Zeichenkette
Eine Zeichenkette, oder auch (engl.) String, ist eine Folge von Zeichen und Symbolen. Als solche werden sie in den meisten Programmiersprachen als Array von chars umgesetzt.
Strings in Java
In Java haben Strings jedoch eine eigene, von anderen Programmelementen abgehobene Syntax und Semantik.
Hier sind Strings keine primitiven Datentypen, sondern werden durch Objekte abgebildet und sind dementsprechendkonstant. Das heißt der Inhalt einer von einem Stringobjekt repräsentierten Zeichenkette kann nicht verändert werden.
Strings besitzen die Eigenschaft, dass sie mit dem +-Operator konkateniert (d. h. aneinandergehängt) werden können. Hierbei werden die an der Operation beteiligten Strings nicht verändert (konstant!). Stattdessen erstellt das Java-Programm neue Stringobjekte und eine Referenz auf diese wird durch den Term repräsentiert.
Im Quellcode kann zudem eine Zeichenkette zwischen Anführungszeichen ( " ) deklariert werden:
String foo = "bar";
Ein zwischen solchen Anführungszeichen angegebener Text ist ein Stringobjekt -- genauer: Eine Referenz auf einen String mit dem entsprechenden Inhalt in einem von der JVM verwalteten Pool an Zeichenketten. Dieser Pool wird während des Übersetzungsprozesses definiert. Kommt eine Zeichenkette, wie z.B. "Hallo Welt", mehrmals direkt im Quellcode vor, repräsentieren alle Vorkommen dieser Zeichenkette eine Referenz auf denselben String im konstanten Stringpool.
Vergleiche
Wenn Strings inhaltlich miteinander verglichen werden sollen, sollte der ==-Operator vermieden werden. Da bei Strings Objekte vorliegen, werden mit dem ==-Operator die Referenzen miteinander verglichen.
String s1 = "Hallo Welt"; String s2 = "Hallo "; String s3 = "Welt"; String s4 = s2 + s3;
In diesem Beispiel läge nahe, dass s1 und s4 der gleiche String sind. Mit dem ==-Operator würden diese Instanzen jedoch nicht die gleichen sein, da s1, s2 und s3 jeweils Referenzen auf den konstanten Stringpool sind, s4 jedoch ein String ist, der lokal im Quellcode erst aus den Fragmenten generiert wird. Der Compiler kann in dem Moment nicht wissen, dass s4 und s1 den gleichen String ergeben würden (er müsste die Operatoren beim Übersetzungsprozess zuerst auswerten, was meistens nicht gewünscht ist), weswegen er auch den daraus entstehenden String nicht aus dem konstanten Stringpool wählt. Die Referenzen der beiden Strings sind also unterschiedlich und s1 == s4
wird zu false ausgewertet.
Stattdessen verwendet man s1.equals(s4)
, da die equals-Methode von Strings die Strings inhaltlich miteinander vergleicht.