Autor Wątek: Prawo Zipfa  (Przeczytany 2448 razy)

Offline ArturJD

  • Piewca tabel
  • Wiadomości: 434
  • Baroque
Prawo Zipfa
« dnia: Grudzień 05, 2015, 15:53:17 »
Znalazłem coś takiego, pewnie to znacie:
https://www.youtube.com/watch?v=fCn8zs912OE

Czy dzieje się to również w językach sztucznych? W Tjevango mam za mało tekstów aby to sprawdzić, jak to się u Was dzieje? Może byłby to test na dobry konlang, czy krzywa układa się tak czy siak zawsze w ten sam sposób?
« Ostatnia zmiana: Grudzień 05, 2015, 16:52:28 wysłana przez ArturJD »
 

Offline Henryk Pruthenia

  • Der Untermenschenbändiger
  • Moderatór
  • Wiadomości: 5 533
  • Thanked: 128 times
  • Pieśń Arjów!
    • Mój konlangerski dorobek
  • Konlangi: Ziemskie, Kyońskie, Adnackie; autor neszszszczyzny
Odp: Prawo
« Odpowiedź #1 dnia: Grudzień 05, 2015, 16:18:26 »
Nie przejrzałem filmiku,  bowiem na tym kanale są też filmiki o teorii płaskiej ziemi.

Offline Obcy

  • Loov þän Semien onn þän Horden!
  • Uciekinier
  • Wiadomości: 1 812
  • Thanked: 28 times
  • Vourfäirer ƨ̆ermaneslands
Odp: Prawo
« Odpowiedź #2 dnia: Grudzień 05, 2015, 16:19:22 »
Ciekawe prawo, tylko jest problem: moje języki są silnie fleksyjnie i wyszłoby bardzo dużo słów występujących niezbyt często, co by nie dało wiarygodnego wyniku. Gdybym miał sprawdzać tę regułę w szemierskim, to bym się doliczył, że każde słowo występuje podobnie często, bo można utworzyć z jednego rzeczownika lub czasownika ze sto innych  :-P A można zmodyfikować tę regułę tak, by liczyć tylko rdzenie słów i częstość występowania tych rdzeni? I przede wszystkim: zna ktoś narzędzia, by sprawdzić to prawo?
« Ostatnia zmiana: Grudzień 05, 2015, 16:22:55 wysłana przez Obcy »
 

Offline ArturJD

  • Piewca tabel
  • Wiadomości: 434
  • Baroque
Odp: Prawo
« Odpowiedź #3 dnia: Grudzień 05, 2015, 17:04:53 »
Nie przejrzałem filmiku,  bowiem na tym kanale są też filmiki o teorii płaskiej ziemi.

Znajdziesz tam też filmiki typu "co się stanie, jak wszyscy podskoczyliby na Ziemi na raz" albo "co by się stało, jeśli przełoży się długą słomkę przez atmosferę, ale one są takie dla beki. Fajne są filmiki np. o paradoksie Banacha czy "what if you were born in space" i inne tego typy "symulacje" oraz wyjaśnienia czy przedstawienia różnych teorii. A w tym filmiku o płaskiej Ziemi chodzi o to, jak wyglądałaby fizyka takiej bryły (pomijając fakt, że samo jej powstanie byłoby nie możliwe z powodu siły grawitacji).

Ciekawe prawo, tylko jest problem: moje języki są silnie fleksyjnie i wyszłoby bardzo dużo słów występujących niezbyt często, co by nie dało wiarygodnego wyniku. Gdybym miał sprawdzać tę regułę w szemierskim, to bym się doliczył, że każde słowo występuje podobnie często, bo można utworzyć z jednego rzeczownika lub czasownika ze sto innych  :-P A można zmodyfikować tę regułę tak, by liczyć tylko rdzenie słów i częstość występowania tych rdzeni?
Myślę, że tak. Jak to już ktoś tu określił, języki aglutynacyjne i analityczne różnią się tylko tym, że te pierwsze nie mają tyle spacji.

I przede wszystkim: zna ktoś narzędzia, by sprawdzić to prawo?
Dołączam się do pytania!
 

Offline Henryk Pruthenia

  • Der Untermenschenbändiger
  • Moderatór
  • Wiadomości: 5 533
  • Thanked: 128 times
  • Pieśń Arjów!
    • Mój konlangerski dorobek
  • Konlangi: Ziemskie, Kyońskie, Adnackie; autor neszszszczyzny
Odp: Prawo Zipfa
« Odpowiedź #4 dnia: Grudzień 05, 2015, 17:39:24 »
Ctrl f?

Offline Toivo

Odp: Prawo Zipfa
« Odpowiedź #5 dnia: Grudzień 05, 2015, 18:31:05 »
Czy dzieje się to również w językach sztucznych?
Nie sprawdzałem dla moich conlangów, ale to bardzo powszechnie znane prawo i raczej można być pewnym, że działa. Różnić się może co najwyżej stała, przez którą mnożymy.

Tutaj coś naukowego na ten temat. Gdzieś był też do tego artykuł.
 

Offline Towarzysz Mauzer

Odp: Prawo Zipfa
« Odpowiedź #6 dnia: Grudzień 05, 2015, 19:23:51 »
Cytuj
Ciekawe prawo, tylko jest problem: moje języki są silnie fleksyjnie i wyszłoby bardzo dużo słów występujących niezbyt często, co by nie dało wiarygodnego wyniku. Gdybym miał sprawdzać tę regułę w szemierskim, to bym się doliczył, że każde słowo występuje podobnie często, bo można utworzyć z jednego rzeczownika lub czasownika ze sto innych  :-P A można zmodyfikować tę regułę tak, by liczyć tylko rdzenie słów i częstość występowania tych rdzeni? I przede wszystkim: zna ktoś narzędzia, by sprawdzić to prawo?
Ale częstość nie ma nic wspólnego z derywacją - to kompletnie nieistotne dla frekwencji słów, z jakich pochodzą rdzeni. W tekstach języka naturalnego dystrybucja słów przebiega zgodnie z prawem Zipfa z uwagi na strukturę informacji - im częstsze słowo, tym bardziej dąży do informacyjnej entropii - czyli po prostu przekazuje mniej informacji.

Narzędzie do przebadania? Jakikolwiek skrypt zliczający częstość słów w tekście (może być AntConc) i Excel do porównania korelacji częstości słów w korpusie i rozkładu przewidywanego prawem Zipfa (1 / [ pozycja słowa na liście frekwencyjnej * ln(1,78 * liczba słów w korpusie) ] ).
Skrzydła miłości, mocy, o wielki, Twardy Jerze,
Rozpostrzyj ponad nami, ogrzej i przyjmij nas. -Mrkalj, Palinodia o twardym jerze
***
VIVAT CAROLVS GVSTAVVS REX POLONIÆ