mirror of
https://github.com/yacy/yacy_search_server.git
synced 2024-09-21 00:00:13 +02:00
70 lines
1.0 KiB
Plaintext
70 lines
1.0 KiB
Plaintext
|
#Deutsche Stopwords.
|
|||
|
|
|||
|
#Diese Datei wurde mit dem Programm YaWoStat erstellt. Als Textkorpus kamen eine deutsche <20>bersetzung der Bibel und eine Unmenge Webseiten zum Einsatz.
|
|||
|
|
|||
|
#Falls jemand diese Datei erg<72>nzen m<>chte, bitte ich folgendes zu bedenken:
|
|||
|
#Ich habe <20>ber jedes Wort einzeln nachgedacht, ob mir spontan Suchanfragen einfallen, die es rechtfertigen w<>rden, dieses Wort zu indexieren.
|
|||
|
#Hier musste ein Mittelweg zwischen Komfort (alle Worte indexieren) und Effizienz und Speicherplatzverbrauch (m<>glichst wenig Worte indexieren) gefunden werden.
|
|||
|
|
|||
|
#Ich denke, diese Datei stellt erst mal einen guten Mittelweg dar und kann _vorsichtig_ im Laufe der Zeit erg<72>nzt werden, wenn der Erg<72>nzende gut dar<61>ber nachdenkt.
|
|||
|
|
|||
|
die
|
|||
|
der
|
|||
|
und
|
|||
|
in
|
|||
|
von
|
|||
|
das
|
|||
|
den
|
|||
|
zu
|
|||
|
f<EFBFBD>r
|
|||
|
ist
|
|||
|
mit
|
|||
|
auf
|
|||
|
sie
|
|||
|
im
|
|||
|
eine
|
|||
|
des
|
|||
|
sich
|
|||
|
nicht
|
|||
|
dem
|
|||
|
auch
|
|||
|
als
|
|||
|
zum
|
|||
|
bei
|
|||
|
wird
|
|||
|
es
|
|||
|
mehr
|
|||
|
hat
|
|||
|
an
|
|||
|
oder
|
|||
|
werden
|
|||
|
aus
|
|||
|
sind
|
|||
|
er
|
|||
|
ich
|
|||
|
in
|
|||
|
aber
|
|||
|
es
|
|||
|
du
|
|||
|
da<EFBFBD>
|
|||
|
dass
|
|||
|
ihr
|
|||
|
ein
|
|||
|
so
|
|||
|
denn
|
|||
|
an
|
|||
|
da
|
|||
|
ihm
|
|||
|
wie
|
|||
|
hat
|
|||
|
euch
|
|||
|
ihn
|
|||
|
vor
|
|||
|
sein
|
|||
|
aus
|
|||
|
nach
|
|||
|
seine
|
|||
|
werden
|
|||
|
mir
|
|||
|
was
|
|||
|
ihnen
|