Text mining (eksploracja tekstu) – ogólna nazwa metod eksploracji danych służących do wydobywania danych z tekstu i ich późniejszej obróbki.
Metody text mining stosowane są np. do statystycznego przetwarzania:
- artykułów prasowych
- wiadomości poczty elektronicznej
- otwartych odpowiedzi na pytania ankietowe
- opisów dolegliwości, podawanych przez pacjentów
- komentarzy do sesji giełdowych i zdarzeń dotyczące spółek
- życiorysów zawodowych i listów motywacyjnych
- tekstów reklamacji konsumenckich
Text mining może polegać na znalezieniu kluczowych fraz, zdań, które zostają następnie zakodowane pod postacią zmiennych numerycznych. Później stosuje się metody statystyki i eksploracji danych w celu odkrycia zależności pomiędzy zmiennymi. Ze względu na to, że powstające zmienne są zwykle nominalne, szczególnie użyteczna jest analiza koszykowa.
Zobacz też
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.