Die Zeiten in denen man mit selbst verfassten Texten auf kleinen Seiten noch wirklich wirtschaftlich arbeiten konnte sind lange vorbei. Neben der Administration unserer Seiten durch Content Managment Systeme wie WordPress oder Drupal ist auch das automatische Content generieren selbst zum Pflichtprogramm geworden. Ob als Black Hat SEO oder als Webmaster mit weißem Hut ist in diesem Fall absolut egal denn es gibt unterschiedlichste Arten Inhalte für eigene Seiten zu erlangen ohne selbst Texte zu schreiben oder zu kaufen. Es folgt nun eine Liste der meisten mir bekannten Möglichkeiten.
Duplicated Content vermeiden oder tarnen
Man wird natürlich bei viele dieser Möglichkeiten auf ein Duplicated Content Problem stoßen also verliere ich nun erst einmal ein paar Zeilen zu diesem Thema. Auf Grund meiner Erfahrungen bezweifel ich stark das Google wirklich Duplicated Content erkennen kann doch werden sie in dem Bereich auch besser daher macht es Sinn das Möglichste zu tun diesen zu vermeiden.
Synonym Rewriting
Dieses Verfahren ist sehr beliebt und Gleichmaßen einfach. Es wird der Texte nach Worten durchsucht die in einer Datenbank stehen und diese dann durch ihr Synonym ersetzt (zB Auto wird durch Wagen ersetzt). Je nachdem wie umfangreich die Datenbank ist wird der Text auch schwerer als Kopie erkannt. Problem ist das er auch unleserlicher wird. Außerdem gibt es starke Unterschiede bei der Qualität der Rewrite Engine und Datenbanken. Ich möchte nun nicht weiter auf dieses Thema eingehen da es doch recht umfangreich ist und den ganzen Post einnehmen könnte. Eine einigermaßen gute deutschsprachige Synonyme Datenbank gibt es im übrigen hier.
Inhalte mixen
Für mich reicht es oft Inhalte von unterschiedlichen Quellen zu mixen. Dies stellt eine gleichbleibende, gute Qualität sicher und macht auch noch am wenigsten arbeit. Ein Nachteil ist natürlich das dies recht leicht zu erkennen ist. Dabei macht mir weniger Google sorgen sondern die Webmaster wenn diese die Nutzung ihres Contents nicht erlaubt haben. Die Folgen kann sich jeder denken, wie man diese vermeidet sollte zumindest jeder BlackHat SEO auch wissen
Texte übersetzten
Die für mich sicherste Lösung ist in jedem Fall das Übersetzen der Texte. Wenn man einen Englisch Sprachigen Text vom Deutschen ins Englische übersetzt wird das zum einen keinem Webmaster auffallen oder wirklich stören und Google kann das zur Zeit sicher nicht erkennen. Der große Nachteil ist das die Lesbarkeit der Texte total den Bach runter geht. Ich nutze zwecks Übersetzung Googles eigene Translation API
– Hier sei Angemerkt das Google eine Menge schicke API’s hat die uns bei der Arbeit helfen können.
RSS Feeds
Die wohl bekannteste Methode fremden Content auf einer eigenen Seite zu verwenden sind RSS Feeds. Sie bieten gleichzeitig ein gutes Beispiel wie ein und die selbe Technik sowohl als Black Hat als auch White Hat verwendet werden kann obwohl annähernd Identisches getan wird.
Eine sehr bekannte Methode von BlackHats ist mit Sicherheit der Autoblog. Die Systematik ist simple. Man erstellt einen Blog und nutzt nun Plugin’s oder Tools wie AutoPostIt um diesen mit den RSS Feeds von anderen Blogs zu füttern. Hierbei empfehlen sich Feeds die den kompletten Post enthalten und nicht nur einen Auszug. Da dies die Default Einstellung von Wordpress ist finde man auch genug “Opfer”. Manuel hat bereits einen sehr guten Post zum Thema Autoblogs verfasst daher verweise ich für Details mal wieder auf seinen Blog.
Eine, als weiß anerkannte Methode ist das RSS Verzeichnis. Es gibt einige Projekte die ein SEO auf jeden Fall haben sollte. Ein RSS Verzeichnis gehört wirklich dazu! Wenn man mal drüber nachdenkt ist es nichts anderes als ein Autoblogs mit mehr Feeds. Nun könnte man argumentieren das bei einem RSS Verzeichniss der Blogbetreiber mittels Ping der Veröffentlichung zustimmt. Dennoch hat sich bei mir, als mein RSS Verzeichnis neu war und ich daher Feeds gespidert habe und eben nicht angepingt wurde, niemals jemand beschwert das er eingetragen ist.
Auch eher Whitehat SEO ist ein RSS Modul. Auf Snipersites sind diese immer gut zu haben. Und zwar macht man hier eigentlich nur eine statische Seite zu irgend einem Keyword (natürlich macht es Sinn dafür ein Script zu nutzen damit es schneller geht). Da Google auf regelmäßige Updates steht wir unsere Seite aber eigentlich nie wieder anschauen wollen nutzen wir hier ein RSS Modul. Dabei nehmen wir ein Paar Feeds von relevanten Blogs und zeigen immer die neusten Nachrichten dieser Blogs an. Wenn man es schlau macht bekommt man sogar noch ein paar Links von diesen Blogs
APIs nutzen – Mashups basteln
Wieder sind alle Farben des SEO Möglich. Es geht bei Mashups um das Neu-Verwenden und Kombinieren der Inhalte anderer Websites. In der Mehrheit sind es die sehr großen Seiten, die APIs anbieten da diese doch einigen technischen Aufwand erfordert. Ein Beispiel für ein nettes Mashup wäre zum Beispiel die Listung der Top10 Lieder oder Bands von Last.fm durch die Last fm Api, kombinieren lässt sich das nun hervorragend mit den Alben der jeweiligen Band + Nutzerbewertungen durch die Amazon API. Um noch ein paar Bilder zu haben (die an der richtigen Position das Adsense Klicken fossieren können) schauen wir uns fix die Flicker API an, fertig ist Laube. An einem Tag erstellt man so locker eine Seite mit tausenden Seiten. Problematisch ist hier der duplicated Content mit der richtigen Mischung aber auch lösbar. Schön ist außerdem das man geschriebene Codes immer wieder verwenden kann. Wenn ich also erstmal eine vernünftige Last.fm Class geschrieben habe wird diese auf diversen Projekten Verwendung finden – Lego bauen quasi.
Site Scraping
Gerade aus den alten Zeiten ohne XML/RSS und APIs noch bekannt und nach wir vor Projekt abhängig nutzbar. Hierbei klaut man komplette Seiten oder Teile der Inhalte mit Hilfe einer Spider/eines Scripts. Da die zuvor genannten Möglichkeiten besser geeignet sind um Texte zu bekomme nutze ich Site Scraping mit folgendem Hintergrund: Wenn sich eine Seite komplett auflöst schaut Google ob diese nicht nur umgezogen ist und wenn die identische Seite nun unter einer anderen Domain auftaucht vererbt Google einen großen Teil des Trusts an diese weiter. Wenn man also weiß das bestimmte Seiten bald nicht mehr da sein werden fängt man an diese zu Scrapen. Ein Beispiel hierfür wäre die Schließung der Ebay Blogs vor einiger Zeit. Schön ist natürlich außerdem das man guten lesbaren unique Content für lau bekommt.
User Generated Content
Im Grunde nicht mein Bereich aber der Vollständigkeit halber gehört User Generated Content dazu. Hier lässt man einfach die User schreiben. Um das zu erreichen muss man im Regelfall jedoch eine Community aufbauen. Bei einem Forum zum Beispiel ist es pflicht Programm am Anfang selber zu Posten oder Posts zu kaufen da niemand in einer leeres Forum schreibt. Ich verwende User Generated Content eigentlich nur zufällig. Es ist zum Beispiel immer nett einen Image Hosting Service zu haben den man dann natürlich eigentlich nur selber nutzt. Da es für andere aber so aussehen muss als wäre es ein “öffentliches Projekt” können auch User hier ihre Bilder hosten, bewerten und Kommentieren lassen. Quasi Ausversehen posten dort nun täglich einige Leute ihre Bilder und reden sogar drüber. Ähnliches kann einem im übrigen auch bei MashUps passieren wenn man einen Fake Rezensions-Seite bastelt und auf einmal Leute anfangen echte Rezensionen zu schreiben. Mehr kann ich zu dem Thema eigentlich nicht schreiben da es wirklich nicht mein Bereich ist.
Ich habe zwar im Gefühl das ich etwas wichtiges Vergessen habe es fällt mir allerdings gerade nicht ein. Vieleicht gibt es also noch ein Update. Ich plane vor allem auf das MashUp Thema tiefer einzugehen, mal sehen ob ich diesen Vorsatz einhalten werde
– So Long, Alles Gute
Hey Namesvetter. Cooler Blog. Cooles Thema. Gut aufbereitet. Aber eine Bitte: Nicht “Dublicated” sondern “Dupelicated”. Zumindest wenn das englisch sein soll!
Hey Karin. Der frühe Vogel fängt den Wurm oder wie?
Danke für Deine Ergänzung, YouTube Video API hätte ich wirklich noch erwähnen können. Nutze sie auch sehr gerne
Moin André, danke das Du mich auf diesen peinlichen, für mich sehr typischen Fehler hinweist. Hab lange überlegt ob ich Dein Comment nicht einfach lösche und den Fehler still und heimlich behebe, aber hey, ich zeig mal Charakterstärke und stehe zu dem Fehler
Andre.fm, das Ding heisst “duplicated” -> http://www.dict.cc/?s=duplicated ![]()
Good stuff!
[...] ganz schnell Aber da das Internet ja frei ist möchte ich auch diesen Link niemanden vorenthalten: Subseo erklärt dort sehr gut wie man automatisch Content generieren kann der nicht als Duplicate Content [...]
@subseo: naja nicht ganz, wir haben bissl Zeitverschiebung und war spät abends
aber so war ich wenigstens mal erste
interessanter Eintrag. Zum Thema APIs: Ich beschäftige mich nihct mehr damit, da ich mittlerweile alles scrape. Wozu erst umständlich sich durch API-Dokumentationen schlagen, wenn man schneller nen Scraper dafür geschrieben hat?
Hey karin, dann gratuliere ich mal zum “erste sein”
@seozoid
Durch API Dokus schlagen muss man sich wirklich sehr selten. In den allermeisten Fällen reicht es sich kurz die nodes des xml anzuschauen. Um dann seine Daten zu erhalten reichen 3 Zeilen Code.
Einen Scraper zu schreiben der dir spezifische Daten zum Beispiel die meistverkauften Produkte unterschiedlicher Kategorien von Amazon holt geht sicher nicht schneller.
Die API Sachen sind leider nicht so einfach ohne Programmierkenntnisse
Wer die RSS Mix Sache par exelance vorgeführt bekommen will, kuckt mal bei trends.abakus-internet-marketing.de/de/ vorbei. Auch was, wozu man PHP Skills braucht. SEO ohne PHP und JavaScript ist irgendwie nur halb so lustig
Hey Seoux, sehe ich auch so. Ohne coden macht BH weder Spaß noch wirklich Sinn. Ich mein, nur die standart Tools zu verwenden ist ja noch kein Black Hat SEO. Und ja, spaß machen würde es auch nicht ohne sich über seine eigenen neuen Masterpieces freuen zu können
Ein weiteres tool gibt es unter: http://www.flyerprint.de/content_generator.php
[...] man die Content-Erstellung nicht auslagern möchte, gibt es einige Methoden, um automatisch Content zu generieren. Durch Aggregieren oder Übersetzen kann man es erreichen, pseudo-unique Texte zu [...]
13. Januar 2010
04:29 Uhr
Moin
wie immer eine tolle Zusammenstellung der wichtigsten Infos *clap*
Was APIs angeht, habe ich auch gute Erfahrungen mit Amazon und ebay gemacht, gerade was den deutschen Markt angeht. Einfach ein plugin (z.b. WPRobot) mit API und ID füttern und los
Jetzt nicht sooo wichtig, aber Youtube-Videos machen sich autoposted in vielen Bereichen ach ganz gut…