![]() |
![]() |
![]()
Post
#1
|
|
Grupa: Zarejestrowani Postów: 8 Pomógł: 0 Dołączył: 2.11.2010 Ostrzeżenie: (0%) ![]() ![]() |
Witam,
zabiram się do napisania skryptu, a właściwie systemu ekspertowego, do klasyfikowania wpisów na podkategorie wg ich treści. Założenia są ogólnie proste, dodajemy wpisy, wpis zawiera treść, temat oraz kategorie główną, np. Rodzina. Po dodaniu wpisu dokonywana jest analiza treści i tematu, w zależności od kategorii (wstępna klasyfikacja podana przez uzytkownika) wybierany jest zestaw podkategorii (np. dla kategorii Rodzina byłoby to mama, tata, dziadek, babcia itd.) i wśród nich odpowiednio do treści wybieranybyłby najbardziej pasujący. Zastanawiam się jak się do tego zabrać, na pewno potrzebna będzie duża baza słownikowa, mam 10 kategorii głównych, no i sam algorytm będzie rzeczą najtrudniejszą. Jeśli ktoś z Was spotkał się z takim problemem, albo ma jakis pomysł na rozwiązanie tego zagadnienia, byłbym bardzo wdzięczny za pomoc, pozdrawiam |
|
|
![]() |
![]()
Post
#2
|
|
Grupa: Zarejestrowani Postów: 8 Pomógł: 0 Dołączył: 2.11.2010 Ostrzeżenie: (0%) ![]() ![]() |
dzięki wielkie, póki co rozważałem teoretyczne podstawy projektu, jak się wezme do pisania na pewno pojawi sie więcej problemów, temat otwarty nadal, wszystkie pomysły mile widziane, cudny dostajesz punkcik i licze na wsparcie w razie kłopotów ; )
Witam ponownie, tak jak pisałem wcześniej pojawiły się problemy. Metoda zliczania słów kluczowych nie zawsze działa tak jak powinna. Skrypt działa w ten sposób, zlicza wystąpienie słów kluczowych, ale potrzebny tez jest jakis warunek po którego przejściu przypiszemy tag do wpisu. I tu pojawia mi się problem, bo nie wiem jak taki warunek skonstruować. 10% wszystkich słów to słowa kluczowe? działa dla krótkich tekstów.. po zmniejszeniu warunku do np 5% dla długich tekstów tez to nie działa jak powinno. Poza tym słowo kluczowe np. 'Mama' moze pojawić się raz czy dwa razy w tekscie, a dalej mozemy się odnosić przez słowa typu 'ona, jej' itd. I tak na prawdę nie widze żadnej uniwersalnej metody dla rozwiązania tego problemu.. szukam juz drugi dzien i nic ciekawego nie mogę znaleźć a projekt moze otrzeć sie o pracę dyplomową.. Jeżeli ktoś orientuje się w temacie, zna się na lingwistyce komputerowej, to prosiłbym o jakies podpowiedzi. Dzięki za pomoc, pozdrawiam |
|
|
![]() ![]() |
![]() |
Aktualny czas: 12.10.2025 - 22:43 |