Seite 1 von 2

Dateiendungen mit mod rewrite ändern (php/html) ...und dann?

Verfasst: 27.04.2009, 10:14
von bmisic
Hallo!

Ich habe bemerkt das es bei vielen großangelegten Projekten oft so gehandhabt wird das .php Dateien via mod rewrite als .html Dateien vorgegaukelt werden.


Dabei stelle ich mir (und damit meine ich Euch) erstmal die Frage warum?
...hat mal jemand tatsächlich eine Auswirkung in den SERPs feststellen können?

Weiter habe ich bemerkt das es bei manchen Projekten möglich ist die .php Datei trotzdem einfach anzusprechen. :o ???
Warum dieses? Wurde hier was vergessen? ...geschludert?

Genügt es die .php Dateien durch die robots.txt zu sperren um DC zu vermeiden? ...die selben Seiten können mit der .php und der .html Endung doch trotzdem immernoch besucht werden (von mir z.B.) Führt das nicht trotzdem zu einem Problem?

Was sollte man denn nun mit seinen .php Endungen am besten anfangen?

Vielen Dank im Voraus!

Verfasst:
von

Hochwertiger Linkaufbau bei ABAKUS:
  • Google-konformer Linkaufbau
  • nachhaltiges Ranking
  • Linkbuilding Angebote zu fairen Preisen
  • internationale Backlinks
Wir bieten Beratung und Umsetzung.
Jetzt anfragen: 0511 / 300325-0

Verfasst: 27.04.2009, 11:34
von e-fee
Sicher ist es möglich, die php-Datei direkt anzusprechen.
Denn sie ist ja "physikalisch" vorhanden, und sie ist auch das, was der Server verarbeitet.
mod_rewrite macht ja nichts anderes, also zu sagen: wenn die und die URL aufgerufen wird (die als Datei auf dem Server nicht existiert), dann wandle das um in eine URL wie index.php?id=xyz und führe das aus und liefer das Ergebnis zurück. Bei Direktaufruf der php-Datei wird ja nur der Schritt der URL-Umwandlung übersprungen.

Wenn allerdings nirgendwo auf die unerwünschten php-Pfade verlinkt wird oder wurde und Du die in dieser Form auch nicht aufrufst, während Du bei Google eingeloggt bist, sollte da auch nix indexiert werden. Und selbst wenn, solche Fälle von DC sind unproblematisch!

Re: Dateiendungen mit mod rewrite ändern (php/html) ...und d

Verfasst: 27.04.2009, 11:37
von Mork vom Ork
bmisic hat geschrieben:Dabei stelle ich mir (und damit meine ich Euch) erstmal die Frage warum?
Viele Leute glauben auch, Eier ließen sich leichter schälen, wenn man sie nach dem Kochen in kaltes Wasser taucht. Warum? Weil's viele andere glauben. Der Wahrheit entspricht es jedoch nicht.
Weiter habe ich bemerkt das es bei manchen Projekten möglich ist, die .php-Datei trotzdem einfach anzusprechen. :o ???
[…] geschludert?
Offensichtlich.

Das Umbiegen von .html-URLs auf .php-Dateien zeugt in der Regel eh von wenig Sachverstand, denn wesentlich einfacher ist es, den Server so einzustellen, dass er .html-Dateien vom PHP-Interpreter verarbeiten lässt. Da sind wir dann wieder bei dem, was ich oben schon angedeutet habe: Alle machen's mit mod_rewrite, dann kann das ja nur richtig sein.
Genügt es die .php-Dateien durch die robots.txt zu sperren um DC zu vermeiden?
Wenn niemand auf eine .php-URL verweist, kann sie auch von keiner Suchmaschine gefunden werden. Im Hinblick auf das Verstecken der Innereien ist es so gesehen überaus unklug, in der robots.txt der bösen Welt bekannt zu geben, was man noch so alles für URLs erwartet. In die robots.txt gehören einzig öffentlich zugängliche bzw. für die Öffentlichkeit gedachte Pfade.

Davon unabhängig: Richtig konfiguriert, siehe oben, stellt sich diese Frage überhaupt nicht.

Verfasst:
von
Content Erstellung von ABAKUS Internet Marketing
Ihre Vorteile:
  • einzigartige Texte
  • suchmaschinenoptimierte Inhalte
  • eine sinnvolle Content-Strategie
  • Beratung und Umsetzung
Jetzt anfragen: 0511 / 300325-0

noch einen hinterher...

Verfasst: 27.04.2009, 11:55
von bmisic
Danke schon mal vielmals für Eure Antworten!

Ich habe grade mal bei Mr. Beus vorbei geschaut...

https://stadt.cityreview.de/berlin/wlan-hotspots/
(zum Beispiel)

Wie macht er das denn?
Man kann weder mit
https://stadt.cityreview.de/berlin/wlan ... /index.php (oder sonst einer Endung)
oder
https://stadt.cityreview.de/berlin/wlan-hotspots.php (oder sonst einer Endung)
auf die Seite zugreifen...
:o

Verfasst: 27.04.2009, 12:07
von Margin
Warum überhaupt so ein Zinober?
Wenn es darum geht, aus kryptischen Dateinamen "sprechende URLs" zu kreieren, ok. Nur warum html als php tarnen oder umgekehrt? Sorry, der Sinn verschließt sich mir bis heute. Vielleicht hat ja auch nur noch nie jemand die schlagenden Argumente gebracht. Ähnlich wie bei den gekochten Eiern oben - das Abschrecken dient dem Stoppen des Garprozesses und nicht der besseren Pellbarkeit.

Re: noch einen hinterher...

Verfasst: 27.04.2009, 12:18
von LinkPop
bmisic hat geschrieben:Danke schon mal vielmals für Eure Antworten!

Ich habe grade mal bei Mr. Beus vorbei geschaut...

https://stadt.cityreview.de/berlin/wlan-hotspots/
(zum Beispiel)

Wie macht er das denn?
Man kann weder mit
https://stadt.cityreview.de/berlin/wlan ... /index.php (oder sonst einer Endung)
oder
https://stadt.cityreview.de/berlin/wlan-hotspots.php (oder sonst einer Endung)
auf die Seite zugreifen...
:o
Ganz einfach: Die von Dir angeforderten URLs gibt es nicht und können deshalb auch nicht abgerufen werden. Möglicherweise liegt im Root einfach nur 'ne index.php (o.ä.) und mittels mod_rewrite wird die Struktur zusammengeschustert.

Verfasst: 27.04.2009, 12:22
von Nullpointer
gibt auch noch content-negotiation. da kann man z.b. die endung weglassen. praktisch, wenn sich mal die verwendeten technologien ändern und man sich um umleitungen oder rewrites keine gedanken machen möchte.

Verfasst: 27.04.2009, 12:49
von bmisic
Das mit der "Pellbarkeit" stimmt aber!
...den Unterschied merkt man allerdings erst wenn die Eier erkaltet sind.

:-?

Verfasst: 27.04.2009, 13:29
von bmisic
@Margin

Ja, genau!
Warum eigentlich eine php als html tarnen?

Ob sich das auf die SERPs auswirkt wollte ich ja durch meine kleine Umfrage (die beim Verschieben wohl verloren gegangen ist...?) mal erfragen.


Es gibt ja Gerüchte das html Dateien als "statische" Seiten gelten und besser ranken, weil Sie als "handgemacht" anerkannt werden und keinen Content Generatoren beherbergen wie das bei einer php der Fall sein kann. (solls ja geben)

Verfasst: 27.04.2009, 13:37
von Margin
Der letzte Teil von Deinem Posting haut so auf jeden Fall nicht hin - beides kann beides sein.

Ich habe jedenfalls "seit Anbeginn" beides und kann keinerlei Unterschiede feststellen. Gegenbeweise habe ich bis heute noch keine gesehen.

Verfasst: 27.04.2009, 13:43
von bmisic
...in der Regel meine ich.

Ich gebe hier nur wieder was ich mal irgendwo (ich glaube hier) gelesen hatte.
:wink:

Verfasst: 27.04.2009, 13:49
von Synonym
Interessantes Thema. Ich frage mich auch immer wieder warum man z.B. aus einem impressum.php ein impressum.html macht um dann intern doch wieder die .php aufzurufen.

Ich für meinen Fall mache es aber auch so und das finde ich hat einen für mich guten Grund. Alle Seiten bei mir werden als .html aufgerufen und dann intern eben die entsprechenden .php-Versionen. Kommt nun einer der direkt die .php aufrufen will, dann gibt es gleich eine Fehlermeldung. Also braucht man da schon mal nix mit robots.txt.

Das Argument .html direkt parsen zu lassen ist natürlich auch eines. Nur es gibt auch echte .html-Seiten, vor allem viele tausende die als statischer Cache hinterlegt sind. Warum sollten die alle durch den PHP-Interpreter gejagt werden wo es definitiv unnötig ist. Ich für meinen Fall dachte da viel mehr an die Performance als an irgendwelche SEO-Geschichten. Es ist einfach schneller einmal eine vHost einzulesen als jedesmal den PHP-Interpreter zu starten -> könnte mich da aber auch irren und es liegt nur am Server :-? . Hab es jedenfalls nun so.

Verfasst: 27.04.2009, 16:35
von e-fee
Ich glaube, manch einer verwechselt hier auch noch 2 verschiedene "Anwendungsformen", hat wohl auch mit der "Größe" der Projekte zu tun bzw. dass einige aus der Selberbastel-Ecke (nicht abwertend gemeint) kommen:

Sicher ist es einigermaßen unsinnig, wenn man ohnehin eine impressum.php besitzt, diese als impressum.html anzuzeigen und dann wieder umzuwandeln. Es sei denn, man möchte irgendwelchem Scriptkiddies vorgaukeln, dass es hier nichts über irgendwelche Parameter zu hacken gibt.
Jaaaa, ich hab früher auch zig verschiedene php-Dateien gehabt, plus dann noch Parameter für Datenbankaufrufe hintendran, so damals als php-Anfängerin, ohne Ahnung von SEO und ohne verfügbares mod_rewrite.

Aber ich gehe jetzt mal von einigermaßen großen Auftritten aus: solche, wie sie auf einem CMS laufen oder (obwohl nicht groß) auch einigen Sachen, die ich derzeit noch in der Pipeline hängen habe, wo einfach alle von Seite zu Seite unterschiedlichen Inhalte aus einer Datenbank ausgelesen werden, selbst das Impressum.
In solchen Fällen werden alle Seiten aus einer einzigen(!) index.php (die aber sehr wahrscheinlich weitere php-Dateien includet) heraus generiert, selbst wenn es Millionen Unterseiten sind (oder auch nur zehn). Alle sonst in DAU-Augen vorhandenen Dateien und Verzeichnisse sind komplett virtuell, sie existieren so auf dem Server nicht. Ihre Namen werden jedoch intern als Parameter (siehe mein Beispiel oben) übergeben und weiterverarbeitet. Meistens handelt es sich dabei direkt um den Schlüsselwert (kann oder kann nicht unique sein) eines Datenbankeintrags, der somit abgerufen wird. Im Beispiel von Sistrix gibt es dann vermutlich eine Datenbanktabelle mit Städten, wo "berlin" der Schlüssel ist. Dann wäre denkbar, dass es eine Datenbanktabelle mit "Nützlichem" gibt, wo dann alle Datensätze abgerufen werden, die "berlin" und in einem anderen Feld "wlan-hotspots" enthalten. Oder wahrscheinlicher eine Tabelle mit den Hotspots, wo aufgrund von "wlan-hotspots" gemeint ist, dass alle Datensätze dieser Tabelle mit (in dem Fall nicht unique) "berlin" ausgegeben werden.
Im Fall von Sistrix bin ich sicher, dass die kompletten Pfade virtueller Struktur sind, denn er ist erstens ein (auf jeden Fall für einen SEO) verdammt guter Programmierer und zweitens meines Erachtens auch sauber arbeitend.
Installiert doch einfach mal ein CMS, Forum, Blog, sonstwas eurer Wahl und guckt euch dann mal die reale Verzeichnisstruktur auf dem Server sowie unter phpmyadmin die Datenbankstruktur an!

Sorry für das leichte Off Topic!
Bezüglich php-Dateien lässt sich noch sagen, dass es früher bei den Suchmaschinen Probleme geben konnte, wenn die angehängten Parameter nicht ausgewertet werden konnten - aber auch das geht mittlerweile, solange es kein Bandwurm ist. Schöner lesbar für den Benutzer sind dennoch die "schönen" URLs, ob jetzt mit .php, .html, ganz ohne Dateiendung nur als Verzeichnis oder mit .schlagmichtot.

Und m.E. gibt es genügend auch hochwertige Seiten, die auf PHP setzen. Außerdem weiß umgekehrt natürlich auch Google, dass hinter .html trotzdem PHP stecken kann und mittlerweile oft auch tut (außerdem wird das glaube ich sowieso vom Server mit übermittelt). Ich glaube nicht, dass das rankingtechnisch irgendeine Rolle spielt, welche Endung ich da jetzt dranhänge. Warum auch? Qualität und Relevanz sind daran einfach nicht ablesbar.
Und DC auf der eigenen Seite wird sowieso von einigen immer überbewertet ("huuuah, wird dann meine ganze Seite abgestraft?" -> so'n Quark, es wird halt nur eine Version in den Index übernommen); solange nicht die Links auf beide Versionen verteilt werden, sollte das absolut unerheblich sein bzw. Google die "doppelte" Version noch nicht mal finden!

Verfasst: 27.04.2009, 17:02
von Lord Lommel
Ich hab mod_rewrite wegen SEO kennengelernt, nutze es aber mittlerweile für alles mögliche. Bei meinen Seiten werden meist alle URLs umgeschrieben, da auch Buttons, Bilder, XML-Dateien aus php-Dateien kommen. Ich finde es recht praktisch, anhand der Endung steuern zu können, ob die index.php oder die button.php angesteuert wird. Natürlich könnte ich es auch mit irgendetwas anderem steuern, z.B. einem Präfix oder ich jager erstmal finzipiell alles durch die index.php. Aber so finde ich es praktisch und wenn jemand ein jpg erwartet, wird er dumm gucken, wenn die URL ne php-Endung hat. Im Zuge dessen ist es nur logisch, bei HTML-Seiten, auch html hinten dran zu schreiben. Schließlich gebe ich ja tatsächlich ne HTML-Seite und keine PHP-Seite an den Nutzer weiter. Ich speichere meine Word-Dokumente ja auch nicht mit ner wav-Endung ab, um dann wav mit Word zu verknüpfen.

Verfasst: 27.04.2009, 17:12
von e-fee
Ähm, jetzt vergleichst du aber Äpfel mit Birnen im letzten Satz!
Denn das, was im Browser ankommt, ist auf jeden Fall HTML, egal, ob es eine statische HTML-Seite ist oder per PHP generiert. Eine PHP-Seite ist beim User sowieso eine HTML-Seite.
Das gilt ist im Fall eines Word-Dokuments und einer WAV-Datei dann aber doch ein bisschen was anderes. Das sind zwei Dateiformate, die nichts miteinander zu tun haben.
Und im Zuge von mod_rewrite kann man das Kind so benennen, wie man lustig ist, eben auch .schlagmichtot, wenn einem danach ist, da man selbst bestimmen kann, ob die Endung überhaupt in irgendeiner Form ausgewertet wird. Und letztlich ist sowohl .php als auch .html gängig und logisch bei Webseiten.