das hängt wohl eher vom inhalt ab.
ich schätze mal, die millionen von seiten bestehen nicht gerade aus hochwertigem content. wieviel seiten waren das? wie kommt man zu soviel seiten?
1. alle seiten unique content, oder wie groß sind die gedoppelten seitenteile?
2. 1 million seiten - und von extern eingehende links nur auf die indexseite?
3. seiten alle relativ gleichwertig untereinander verlinkt?
4. saubere urls? sessonids oder modrewrite?