|
Alternativen
zu Soundex
Metaphone
Eine populäre Alternative zu Soundex ist
der Metaphone-Algorithmus, welcher erst von Lawrence Philips in der
Ausgabe vom Dezember 1990 der Zeitschrift „Computer
language“ beschrieben wurde. Metaphone ist eine verbesserte
Version von Soundex, die eine zu grobe Analyse von Wörtern
vermeidet.
Metaphone arbeitet genauer als Soundex und ist empfindlicher
für Veränderungen bei der Reihenfolge der Buchstaben
und Kombinationen wie z.B. „th“.
Es basiert auf einem Verfahren, das jedes Wort auf 16 Konsonanten
reduziert. Die Genauigkeit bleibt erhalten und die Variablenbereiche
werden wesentlich verkürzt.
Die Grundregeln des Metaphone-Algorithmus:
16 Konstanten: B X S K J T F H L M N P R 0 W Y
„th“ = 0
Ausnahme:
Beim Beginn eines Wortes mit "ae-", "gn", "kn-", "pn-", "wr-" wird der
erste Buchstabe ausgelassen
|
|
Transformation
----> |
|
B
|
B, wenn am Ende
des Wortes "m" |
|
C
|
X (sh), wenn "-cia-" oder "-ch-" |
| S, wenn "-ci-", "-ce-", oder "-cy-" |
| wird nicht gesprochen,wenn "-sci-",
"-sce-", oder "-scy-" |
| K, wenn in "-sch-" |
|
D
|
J, wenn in
"-dge-", "-dgy-", or "-dgi-" |
| T, in allen
anderen Fällen |
|
F
|
F |
|
G
|
wird nicht
gesprochen, wenn nicht in "-gh-" am Ende oder vor einem Vokal, acuh wenn
in "-gn" or "-gned" oder
in "-dge-" etc. |
| J wenn vor "i", or
"e", oder "y", wenn nicht "gg" |
| K, in allen
anderen Fällen |
|
H
|
wird nicht gesprochen, wenn nach dem Vokal
oder kein Vokal folgt
oder nach "-ch-", "-sh-", "-ph-", "-th-", "-gh-" |
| H, in allen anderen Fällen |
|
J
|
J |
|
K
|
wird nicht gesprochen, wenn nach "c" |
| K, in allen anderen Fällen |
|
L
|
L |
|
M
|
M |
|
N
|
N |
|
P
|
F wenn vor "h" |
| P, in allen anderen Fällen |
|
Q
|
K |
|
R
|
R |
|
S
|
X (sh), wenn vor
"h" oder in "-sio-" oder "-sia-" |
| S, in allen
anderen Fällen |
|
T
|
X (sh), wenn "-tia-" oder "-tio-" |
| 0 (th) wenn vor "h" |
| wird nicht gesprochen, wenn in "-tch-" |
| T, in allen anderen Fällen |
|
V
|
F |
|
W
|
W, wenn zusammen mit dem Vokal |
| wird nicht gesprochen, wenn kein Vokal folgt |
|
Wh
|
W, wenn das Wort
mit "Wh" beginnt. Beispiel: "Whalen" |
|
X
|
KS |
| S, wenn das Wort mit X beginnt. Beispiel:
"Deng Xiaopeng" |
|
Y
|
wird nicht
gesprochen, wenn nicht zusammen mit einem Vokal |
| Y, wenn zusammen
mit einem Vokal |
|
Z
|
S |
|
|
Metaphone
Double
Metaphone
Caverphone
Q-gram
NYSIIS
|