Files

Abstract

A tanulmányban a Weka adatbányászati szoftver használata és a szövegosztályozás alapelvei kerülnek bemutatásra. Egy gyakorlati példán keresztül, amiben Internetről letöltött 4000 db ingatlanhirdetési szöveget dolgoztam fel, több szövegosztályozási módszert megvizsgáltam. Voltak olyan módszerek, amelyekhez a Weka beépített algoritmusát használtam fel, és előfordultak olyanok is, amelyekhez saját programot készítettem. Több módszert is részletesen elemeztem a paraméterek beállításának változtatásával. Az egyes módszerek eredményeit összehasonlítottam az osztályozási pontosság és a futási idő szerint. A feladatokhoz a programokat Java nyelven írtam meg. ---------------------------------------------------------------------------------- In my work I presented the usage of the Weka data-mining software and the principles of text classification. I examined several text classification methods with the help of a practical example, where I processed 4000 real estate advertisements from Internet. I used the Weka built-in algorithms for some methods and I wrote programs for the others. I analyzed some methods in detail with different parameters. I compared the results of the methods from the point of view of precision and execution time. I wrote the programs in Java language for the tasks.

Details

Downloads Statistics

from
to
Download Full History