yacy_search_server/defaults/yacy.stopwords.de
reger ee277b9b3e allow for local yacy.stopwords and yacy.badwords list (in DATA/SETTINGS/)
if file in DATA/SETTINGS it is loaded otherwise file in ./defaults is loaded
   (if locale ./defaults/stopwords.xx doesn't exist take solr/lang/stopwords_xx.txt as default)

move yacy.stopwords, yacy.stopwords.de and yacy.badwords.example out of root directory to ./defaults directory
2014-11-23 05:22:23 +01:00

70 lines
1.0 KiB
Plaintext

#Deutsche Stopwords.
#Diese Datei wurde mit dem Programm YaWoStat erstellt. Als Textkorpus kamen eine deutsche Übersetzung der Bibel und eine Unmenge Webseiten zum Einsatz.
#Falls jemand diese Datei ergänzen möchte, bitte ich folgendes zu bedenken:
#Ich habe über jedes Wort einzeln nachgedacht, ob mir spontan Suchanfragen einfallen, die es rechtfertigen würden, dieses Wort zu indexieren.
#Hier musste ein Mittelweg zwischen Komfort (alle Worte indexieren) und Effizienz und Speicherplatzverbrauch (möglichst wenig Worte indexieren) gefunden werden.
#Ich denke, diese Datei stellt erst mal einen guten Mittelweg dar und kann _vorsichtig_ im Laufe der Zeit ergänzt werden, wenn der Ergänzende gut darüber nachdenkt.
die
der
und
in
von
das
den
zu
für
ist
mit
auf
sie
im
eine
des
sich
nicht
dem
auch
als
zum
bei
wird
es
mehr
hat
an
oder
werden
aus
sind
er
ich
in
aber
es
du
daß
dass
ihr
ein
so
denn
an
da
ihm
wie
hat
euch
ihn
vor
sein
aus
nach
seine
werden
mir
was
ihnen