mirror of
https://github.com/yacy/yacy_search_server.git
synced 2024-09-19 00:01:41 +02:00
german stopwords.
We should try to use language dependent wordfiles as fast as possible, because they will prevent the indices from getting big with useless (very common) words, which have no function, while the stopwords used at the moment filter too much. git-svn-id: https://svn.berlios.de/svnroot/repos/yacy/trunk@728 6c8d7289-2bf4-0310-a012-ef5d649a1542
This commit is contained in:
parent
c256ab0532
commit
0d319fff41
70
yacy.stopwords.de
Normal file
70
yacy.stopwords.de
Normal file
|
@ -0,0 +1,70 @@
|
|||
#Deutsche Stopwords.
|
||||
|
||||
#Diese Datei wurde mit dem Programm YaWoStat erstellt. Als Textkorpus kamen eine deutsche Übersetzung der Bibel und eine Unmenge Webseiten zum Einsatz.
|
||||
|
||||
#Falls jemand diese Datei ergänzen möchte, bitte ich folgendes zu bedenken:
|
||||
#Ich habe über jedes Wort einzeln nachgedacht, ob mir spontan Suchanfragen einfallen, die es rechtfertigen würden, dieses Wort zu indexieren.
|
||||
#Hier musste ein Mittelweg zwischen Komfort (alle Worte indexieren) und Effizienz und Speicherplatzverbrauch (möglichst wenig Worte indexieren) gefunden werden.
|
||||
|
||||
#Ich denke, diese Datei stellt erst mal einen guten Mittelweg dar und kann _vorsichtig_ im Laufe der Zeit ergänzt werden, wenn der Ergänzende gut darüber nachdenkt.
|
||||
|
||||
die
|
||||
der
|
||||
und
|
||||
in
|
||||
von
|
||||
das
|
||||
den
|
||||
zu
|
||||
für
|
||||
ist
|
||||
mit
|
||||
auf
|
||||
sie
|
||||
im
|
||||
eine
|
||||
des
|
||||
sich
|
||||
nicht
|
||||
dem
|
||||
auch
|
||||
als
|
||||
zum
|
||||
bei
|
||||
wird
|
||||
es
|
||||
mehr
|
||||
hat
|
||||
an
|
||||
oder
|
||||
werden
|
||||
aus
|
||||
sind
|
||||
er
|
||||
ich
|
||||
in
|
||||
aber
|
||||
es
|
||||
du
|
||||
daß
|
||||
dass
|
||||
ihr
|
||||
ein
|
||||
so
|
||||
denn
|
||||
an
|
||||
da
|
||||
ihm
|
||||
wie
|
||||
hat
|
||||
euch
|
||||
ihn
|
||||
vor
|
||||
sein
|
||||
aus
|
||||
nach
|
||||
seine
|
||||
werden
|
||||
mir
|
||||
was
|
||||
ihnen
|
Loading…
Reference in New Issue
Block a user