8Sep/09Off

twitter spambot statisztika

Korábban már írtam a twitter spamről és részletesen bemutattam, hogyan is működnek a twitter spam robotok. Hamisítottam tweeteket, üzembe állítottam 4-5 saját spam robotot, amit csak lehetett retweeteltek a botok. Pár hét, hónap késéssel pedig a bit.ly API segítségével lehúztam a bit.ly-n keresztűl fűzött urlek statisztikáját.

A módszerről röviden, felfrissítendő a project hátterét.

A twitter API-n keresztűl szondáztam a twitter public time line-t és ha a botokhoz (hashgoogle, hashbing) passzoló tweetet találtam, a botok kikapták az tweetben szereplő web címeket és átalakították a bit.ly apival saját short urlre. Ha már eleve shortenelt web cím volt, az untinyurl apival visszaalakították az eredeti webcímet, majd bitlyvel rövidítették. A tweetet ezután retweetként beküldték a twitter zajába.

A robotok ily módon rengeteg status updatet követtek el,  gyűjtögették a követőket. A @hashgoogle rekordja kb. 1,200 követő, a @hashbing kb. 900 követőig „fejlődött”. Természetesen a twitter egy idő után nem nézte jó szemmel a botokat. Bár account suspend-re nem került sor, azért a botok status updatejeit eltüntették a keresőből és public time line-ból.

A lényeget egy táblázatba foglaltam össze, ami szerintem magáért beszél. Ha tömeg felkap valamit akkor az pörög. A twitter zajában azonben nehéz nulla branddel érvényesülni, csak és kizárólag lopott tartalommal középszerű eredmények érhetőek el.

A valódi sikert az igazi, saját magunk által előállított tartalom hozhat. Ha felkapja a tömeg.

22Jul/090

Instant twitter bot

Must read: Using the Twitter API with PHP and PEAR.

Talán még azok számára is érhetővé válhat, hogy mennyire sebezhető platform a twitter, mennyire egyszerű spamelni a twitteren, akik nem értenek a programozáshoz, ha 'kézzelfogható' lesz egy twitter spambot. Ezért oktatási és demonstrációs céllal publikálom a korábban már említett, kb. 160 soros php twitter re-tweet botot. Elméletben csak a konfig szekcióban kell az adatokat megadni és a bot máris ontja a spamet (megfelelő üzemeltetési környezet természetesen szükséges, php és cron vagy cronnak megfelelő periodikus futást lehetővé tevő alakalmazás).

Jelen pillanat a twitter spambotoknak igazából semmilyen visszafogó módszerét nem ismerem. Az ip tíltás max lassító eszköz a twitter kezében.

A twitteren, véleményem szerint, három olyan spamelési forma van, ami kifizetödő lehet:

A re-tweetről postolok részletesebben a későbbiekben. A fake re-tweet lehet a twitter egyik nagy bukása, biztonsági kérdése. Phsingtől kezdve bármilyen támadási módra lehetőséget ad, ha más nevében elküldött tweetnek álcázzák a tweetet, ugyanis bizalmi helyzetet alakithat ki.

Pl. RT @hh muszaj megnezned neked is http://fakeshortenmalwareurl/ #fail #webi #lol

Az egymással tweetelő botok még talán futurisztikus dolog, de a getafreelancer.com -on már fel-feltűnedeznek ilyen projectek. Itt a lényeg a zaj fenntartása anélkül, hogy a twitter bármit is tudna tenni ez ellen.

A bothoz pár megjegyzés:

  • paraméterben megadott feltételek szerint keres,
  • a találatokat re-tweeteli, paraméterezhető, hogy az eredeti tweet usert hozzáfűzze a tweethez -> fake tweeting, -> re-tweet spam
  • a tweetben elhelyezett linkeket shorteneli bit.ly-n, ha szükséges akkor az eredeti urlt kicsomagolja (untiny.com api) -> elviekben semmi akadálya, hogy a saját maleware shorten urlt használjon az eredeti, long url ismeretében
  • user és szöveg tíltható a retweetből, -> megfelelő szöveg szűréssel életszerűen twitelheti mások tweetjét és spamelni se tudja más robot (ha időben felismered, h támadják a botot),
  • sql free, log fájlt használ adatbázisként -> elviekben bármelyik botnet alkalmas lehet twitter spamre.

Program készítésekor nem volt cél a szép és gyors kód, annál inkább cél volt, hogy a lehető legprimitívebb legyen, azaz a valóban bárki által elkészíthetőség bizonyítva legyen. Ennek érdekében pár dolgot módosítottam a kódban, így elképzelhető, hogy bizonyos funkciók bugosak vagy nagyon lassúak lettek (pl. string searchok regexp helyett).

Nem túlzás, de spambotot bárki képes irni magának, akár otthonról egy ubuntu alól futathat botot, aki gyűjtöget, re-tweetel, reklámoz, spamel. (Természetesen léteznek web2 oldalak, ahol x funkció megold a weboldal, de  értelmes tartalmat nem küld a user helyett).

Semmilyen felelősséget nem tudok érte vállalni és természetesen referenciaként se vállalom annyira csúf lett :)

Disclaimers

  • És persze: a program kizárólag demonstrációs céllal készült, ennek megfelelően ne használd éles környezetben mert csúf dolgokat írhat a php logba és a twitter se fog szeretni.
  • Robot @hashgoogle és @hashbing accountok alatt megtekinthető, még kb. egy hétig élnek (2009. aug. 1).
  • A spam egy olyan általános probléma, ami nem twitter specifikus, de a twitteren egyre komolyabb problémává válik.
  • oszd meg, tanulj, és adj vissza a közösségnek.

removed.  A twitter API jelentős upgraden "esett át", a robot inkompatibilissá vált.

20Jul/090

Twitter stats – part 001

Pár hete beindítottam egy miniprojecetet, amivel -többek közt- a twittert szerettem volna felmérni, megismerni.
A project gerince két re-tweet bot, @hashbing és @hashgoogle. A két bot (egy-egy php script) periodikusan belehallgatott a twitter zajába és bizonyos feltételeknek megfelelő tweeteket retweetelt. Sokak szerint ez puszta spamelés (én is ebbe a csoportba tartozok), mások szerint a RT a twitter.com lényege (ők se tévednek sokat).
A botok 5-7-8 percenként "zajongtak", egy alkalommal maximum 15 tweetet nyomtak be a twitter apin keresztül.
hashgoogle

Project elso fazisa: Followers gyujtes

Indulás: kb. 2009-06-27
@hashbing: 672 followers, 3,100 update
@hashgoogle: 1,092 followers, 8,200 update
A módszerről
A legfavágóbb de ugyanakkor legcélravezetőbb módszernek a re-tweet robotot tartottam, gyorsan, olcsón lehet tartalomhoz jutni és ez a userek számára a legkevésbé fájdalmas, leginkább elfogadható módszer. A botok idővel egyre "inteligensebbek" lettek, bekerült pár kifejezés és user tiltása. Minden odafigyelés ellenére hashgoogle-t 4-5 alkalommal sikeresen támadta spamrobot, igy párszor kiszórt pár olyan linket ami ebookot, szolgáltatást spamelt #google hashtaggel.
A project utolsó hetében a twitter kitiltotta a botok updatejeit a twitter keresőből, innentől kezdve gyakorlatilag a robotok eltűntek a public timeline és search resultra épített botok elől. Fontos esemény volt még, egy nagyobb robot takarítás, miután hashgoogle-ról kb. 320 robotot vágtak le (1,200+ követőről 900+ követő).
A robotokat meglehetősen nagy rugalmassággal fogadták a twitteren, összesen két alkalommal jelentették fel őket a @spam usernél (egy alkalommal lemaradt a hashmark a #bing elől, így hirtelen rengeteg retweetet eresztett el a bot, másik alkalommal adatbázis hiba miatt duplikáltan küldte ki a zajt a hashgoogle). Három-négy user probált belekötni közvetlen üzenettel. Ugyanakkor több száz köszönetet kaptak a retweetekért.
Összegzés
A retweet (hashbotok) teljesen elfogadottak a twitteren. A userek nagyon nagy része örömmel fogadja, a retweetet és az esetek nagy százalékában be is állt követőnek. A twitter megtűri a retweet botokat, de nem támogatja a használatuk (search és public timeline ban). A spambotok egyenesen imádják a retweet botokat.

Preview: Project masodik fazisa: CT stat gyujtes

A következő postban erről lesz szó:
"A robotok következő lépésként a tweetekben található urleket újracsomagolták, a short linkeket kibontották és saját bit.ly linkekké alakították át. Közel 2,000 link került ily módon átalakításra. A bit.ly remek platform a linkek nyomonkövetésére, bár a rendelkezésükre álló adatok kb. 1%-át adják vissza, arra bőven elegendő, hogy képet alkossunk egy robot pénz termelő lehetőségéről.
Talán project során itt érhető meg legjobban, mennyire fontos a twitteren a retweet és az igazán sikeres traffic vadászok miért szemetelnek annyit."
A cél: mindig bent maradni a zajban.
mashable