Polskie Forum Językowe

Językoznawstwo => Lingwistyka ogólna => Wątek zaczęty przez: ArturJD w Grudzień 05, 2015, 15:53:17

Tytuł: Prawo Zipfa
Wiadomość wysłana przez: ArturJD w Grudzień 05, 2015, 15:53:17
Znalazłem coś takiego, pewnie to znacie:
https://www.youtube.com/watch?v=fCn8zs912OE

Czy dzieje się to również w językach sztucznych? W Tjevango mam za mało tekstów aby to sprawdzić, jak to się u Was dzieje? Może byłby to test na dobry konlang, czy krzywa układa się tak czy siak zawsze w ten sam sposób?
Tytuł: Odp: Prawo
Wiadomość wysłana przez: Henryk Pruthenia w Grudzień 05, 2015, 16:18:26
Nie przejrzałem filmiku,  bowiem na tym kanale są też filmiki o teorii płaskiej ziemi.
Tytuł: Odp: Prawo
Wiadomość wysłana przez: Obcy w Grudzień 05, 2015, 16:19:22
Ciekawe prawo, tylko jest problem: moje języki są silnie fleksyjnie i wyszłoby bardzo dużo słów występujących niezbyt często, co by nie dało wiarygodnego wyniku. Gdybym miał sprawdzać tę regułę w szemierskim, to bym się doliczył, że każde słowo występuje podobnie często, bo można utworzyć z jednego rzeczownika lub czasownika ze sto innych  :-P A można zmodyfikować tę regułę tak, by liczyć tylko rdzenie słów i częstość występowania tych rdzeni? I przede wszystkim: zna ktoś narzędzia, by sprawdzić to prawo?
Tytuł: Odp: Prawo
Wiadomość wysłana przez: ArturJD w Grudzień 05, 2015, 17:04:53
Cytat: Henryk Pruthenia w Grudzień 05, 2015, 16:18:26
Nie przejrzałem filmiku,  bowiem na tym kanale są też filmiki o teorii płaskiej ziemi.

Znajdziesz tam też filmiki typu "co się stanie, jak wszyscy podskoczyliby na Ziemi na raz" albo "co by się stało, jeśli przełoży się długą słomkę przez atmosferę (https://www.youtube.com/watch?v=im7DzMr8Ygs), ale one są takie dla beki. Fajne są filmiki np. o paradoksie Banacha czy "what if you were born in space" i inne tego typy "symulacje" oraz wyjaśnienia czy przedstawienia różnych teorii. A w tym filmiku o płaskiej Ziemi chodzi o to, jak wyglądałaby fizyka takiej bryły (pomijając fakt, że samo jej powstanie byłoby nie możliwe z powodu siły grawitacji).

Cytat: Obcy w Grudzień 05, 2015, 16:19:22
Ciekawe prawo, tylko jest problem: moje języki są silnie fleksyjnie i wyszłoby bardzo dużo słów występujących niezbyt często, co by nie dało wiarygodnego wyniku. Gdybym miał sprawdzać tę regułę w szemierskim, to bym się doliczył, że każde słowo występuje podobnie często, bo można utworzyć z jednego rzeczownika lub czasownika ze sto innych  :-P A można zmodyfikować tę regułę tak, by liczyć tylko rdzenie słów i częstość występowania tych rdzeni?
Myślę, że tak. Jak to już ktoś tu określił, języki aglutynacyjne i analityczne różnią się tylko tym, że te pierwsze nie mają tyle spacji.

Cytat: Obcy w Grudzień 05, 2015, 16:19:22
I przede wszystkim: zna ktoś narzędzia, by sprawdzić to prawo?
Dołączam się do pytania!
Tytuł: Odp: Prawo Zipfa
Wiadomość wysłana przez: Henryk Pruthenia w Grudzień 05, 2015, 17:39:24
Ctrl f?
Tytuł: Odp: Prawo Zipfa
Wiadomość wysłana przez: Toivo w Grudzień 05, 2015, 18:31:05
Cytat: ArturJD w Grudzień 05, 2015, 15:53:17
Czy dzieje się to również w językach sztucznych?
Nie sprawdzałem dla moich conlangów, ale to bardzo powszechnie znane prawo i raczej można być pewnym, że działa. Różnić się może co najwyżej stała, przez którą mnożymy.

Tutaj coś naukowego na ten temat. (http://www.christianbentz.de/Posters/ChrisBentz_Poster.pdf) Gdzieś był też do tego artykuł.
Tytuł: Odp: Prawo Zipfa
Wiadomość wysłana przez: Towarzysz Mauzer w Grudzień 05, 2015, 19:23:51
CytatCiekawe prawo, tylko jest problem: moje języki są silnie fleksyjnie i wyszłoby bardzo dużo słów występujących niezbyt często, co by nie dało wiarygodnego wyniku. Gdybym miał sprawdzać tę regułę w szemierskim, to bym się doliczył, że każde słowo występuje podobnie często, bo można utworzyć z jednego rzeczownika lub czasownika ze sto innych  :-P A można zmodyfikować tę regułę tak, by liczyć tylko rdzenie słów i częstość występowania tych rdzeni? I przede wszystkim: zna ktoś narzędzia, by sprawdzić to prawo?
Ale częstość nie ma nic wspólnego z derywacją - to kompletnie nieistotne dla frekwencji słów, z jakich pochodzą rdzeni. W tekstach języka naturalnego dystrybucja słów przebiega zgodnie z prawem Zipfa z uwagi na strukturę informacji - im częstsze słowo, tym bardziej dąży do informacyjnej entropii - czyli po prostu przekazuje mniej informacji.

Narzędzie do przebadania? Jakikolwiek skrypt zliczający częstość słów w tekście (może być AntConc (http://www.laurenceanthony.net/software/antconc/)) i Excel do porównania korelacji częstości słów w korpusie i rozkładu przewidywanego prawem Zipfa (1 / [ pozycja słowa na liście frekwencyjnej * ln(1,78 * liczba słów w korpusie) ] ).