Hallo Christian,
das ist kein Problem, sondern deutsche Normung.
Heisst, daran ist nichts falsch.
Die DIN 5007 schreibt es so vor:
DIN 5007 Variante 1 (für Wörter verwendet, etwa in Lexika; Abschnitt 6.1.1.4.1)
* ä und a sind gleich
* ö und o sind gleich
* ü und u sind gleich
* ß und ss sind gleich
Ich gebe Dir Recht, dass es ungewohnt ist.
Man erwartet bei u eventuell noch alle ü aber bei ü nicht alle u.
Darüber lässt sich die DIN aber nicht aus.
Für LATIN1 gibt es daher für diverse Länder gesonderte COLLATIONS, in denen Länderspezifische Regeln und Eigenarten berücksichtigt werden.
Für UTF8 gibt es nur einen für alle Länder.
Übrigens ist utf8_general_ci veraltet, nimm bitte utf8_unicode_ci.
Da dieser aber für alle Länder gilt, lassen sich hier nicht soviele Ausnahmeregeln festlegen. Es gilt hier zum Beispiel (wurde von einer Weltkommission, dessen Namen ich vergessen hab beschlossen), dass es für jedes Sonderzeichen nur einen equivalenten Buchstaben gibt.
Für Deutschland wurde daher die oben kopierte Regel verwendet.
Nicht nur MySQL, sondern auch die Betriebssysteme stricken hier noch massiv an einer besseren Lösung. Der unten stehende Artikel zeigt Dir vielleicht, wie schwer das ganze ist:
http://www.heise.de/newsticker/meldung/89748
Achso, dass ü zwar u ist aber u nicht ü ist in diesem umfassenden Welt-Sortierungsregelungswerk natürlich auch nicht möglich. Abgesehen, dass davon auch nichts in unserer DIN steht.
Ich hoffe, ich konnte Dir Frage zufriedenstellend beantworten. Als Lösung bleiben leider nur zwei Alternativen über:
1. Damit leben
2. Auf Latin1 plus latin1_german2_ci umsteigen.
Susanne