Czy istnieje dziedzina w języku polski, która bada w jakim najczęściej kontekście występuje dane słowo.
- Przykład dla "drzwi" to zamek, klamka, zawias, naprawa, sprzedaż.
- Przykład dla "zamek do drzwi" klucz, drzwi, metal, naprawa, sprzedaż.
Jak to można przeanalizować, czy są jakieś programy do tego.
Może nie dokładnie konteksty, a kolokacje (sąsiedztwo wyrazów, współwystępowanie w związkach wyrazowych) wyszukuje w NKJP PELCRA-Kolokator http://www.nkjp.uni.lodz.pl/collocations.jsp (http://www.nkjp.uni.lodz.pl/collocations.jsp).
Dla "drzwi" na czołowych pozycjach znajduje on: skrzypnąć, trzasnąć, wejściowe...
a dla "u drzwi": dzwonek, klamka, zamek...
Nie wiem, czy są jakieś skuteczne automatyczne anotatory semantyczne np. opierające się o WordNet. Zawsze można przeanalizować kolokacje leksemu w korpusie (np. NKJP) i sklasyfikować kolokaty według kontekstów (choć zapewne spora część wyników będzie niejednoznaczna).
Dziękuję za naprowadzenie. Właśnie zagłębiam się w temacie.
Rozważam też inne rozwiązanie. Można wziąć kilka ebooków i poprzez oprogramowanie przeanalizować każde zdanie, gdzie wystąpiło słowo "drzwi". Potem pogrupuje się słowa (które wystąpiły w tych zdaniach) wg ilości powtórzeń. To jakiś wynik bazowy nam da. Reszta pracy to ręczna selekcja.