Das Ding mit dem Captcha Breaking

10. September 2009

Bei diversen Web2.0 Seiten finden sich zum Spamschutz Captcha’s. Um nach wie vor erfolgreich mit eigenen Spam- und Linkbuilding Tools arbeiten zu können muss nun dringend eine Lösung her um dieses lästige Übel umgehen. Der folgende Artikel handelt von meinen Erfahrungen und Lösungen zum Thema Captcha Breaking.

Die nahe liegende Lösung: OCR
Dir Abkürzung OCR steht für Optical Character Recognition, also die “normal” Texterkennung, die wir bereits von diversen Scanner Tools kennen wenn wir Handschriftliche Texte digital editieren und speichern möchten. Viel schwerer als meine Handschrift ist selten ein Captcha zu lesen :)

Sich ein derartiges Tool selber schreiben zu wollen ist je Art des Captcha’s unterschiedlich schwer. Fest steht das man es nicht schaffen wird einen Captcha Breaker zu schreiben der eine Vielzahl unterschiedlicher Varianten lösen kann da sich die verschiedenen Ansätze doch sehr unterschiedlich sind, schon beim entfernen der encrypting Parameter wird man auf Probleme stoßen. Hat man jedoch erst einmal seinen Basis Code ist es oft sehr einfach eine neue Variante hinzu zu fügen. Eine gute Grundlage für die Entwicklung einer eigenen Lösung bietet dieses Tool. Die HowTo ist außerdem sehr aufschlussreich und bietet weit mehr Info’s zu dem Thema als ich sie hier bieten möchte.

Man kann diese Programme auch kaufen doch leider sind diese recht teuer und lösen immer nur ein bestimmtes Captcha, so ist der aktuelle Preis des GMail Captcha Solvers bei 6.000$. Ein weiterer Nachteil ist das ich ausschließlich Chinesische Anbieter gefunden habe und da doch ein wenig Angst um mein Geld hätte.

User Generated Captcha Breaking :D
Etwas tricky aber es funktioniert. Die Grundlage ist schnell erklärt: Ihr zeigt auf einem eurer Projekte dem User ein Captcha das er eintippen muss um irgend etwas zu bekommen. Doch dieses Captcha ist natürlich nicht von Euch sondern ein für euch zu lösendes. Nun hat dieser Ansatz den Nachteil das ihr eine Menge Traffic benötigt damit das auch umsetzbar ist, außerdem muss der User natürlich den Willen haben für “Etwas” einen Captcha Code einzugeben. Gut funktioniert diese Variante im Porno und Warez Bereich, ich denke jeder kann sich vorstellen wie ich das meine.

Captcha Breaking made in India
Diese Möglichkeit ist wohl die einfachste. Es gibt verschiedenste Unternehmen, die das Captcha Breaking als Dienstleistung anbieten. Hier sendet man einfach nur per API das Bildchen hin und je nach Unternehmen bekommt man in wenigen Sekunden den Code zurück. Doch wer jetzt denkt die Leute hätten einfach nur sehr gute Tools irrt.  Vielmehr ist es so das diese , meist in Indien und China ansässigen Unternehmen, eine Horde Angestellter in einem Saal sitzen haben und diese den ganzen Tag nichts anderes machen als unsere Captcha’s zu lösen.  Die Lösungsrate liegt zwischen 70% und 90%. Die Preise gehen von 2$ per 1000 Breaks bei Captchar bypass bis 40$ per 1000 Breaks bei Captcha King.

Resume
Da ich selber lieber meine Tools optimiere als mich um eine gute OCR Lösung zu kümmern war die Entscheidung klar auf der Seite eines Indischen Unternehmens. Die kosten sind für unsere Verhältnisse wirklich zu vernachlässigen und die Lösungsrate ist höher als bei jeder alternative. Ich möchte das Unternehmen welches ich gewählt habe hier nicht schreiben da jeder neue Kunde die Performance drückt aber ich denke hier sind alle des Googlens mächtig :)

2 Reaktionen zu “Das Ding mit dem Captcha Breaking”

Alex
1. November 2009
17:16 Uhr

Tja, die Wahl wird wohl nicht schwergefallen sein ;)
Blöd nur dass sie jetzt ihr System geändert haben und es “priority customers” gibt. Also einfach nicht am Abend nutzen, wenn der load auf 100% geht…
Das Geld ists alle mal wert und wenn du den API nimmst statt http post method, geht sogar die standard rate auf anstatt noch $2 draufzuzahlen für missed captchas :)

subseo
1. November 2009
23:42 Uhr

Hehe, jo, genau die Wahl habe ich getroffen. Ich finde die priority Lösung Super. 1$ mehr pro 1k Captchas und schon läuft es. Davon abgesehen haben wir eh den Bonus etwas anderes Zeiten zu haben als die Amis, Sachen die ich nur einmal am Tag für wenige Stunden laufen lasse schmeiße ich einfach Vormittags an, da ist der load logischerweise immer sehr gering.

Einen Kommentar schreiben