Skip to content

nymwa/ConLangLM

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

13 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

架空世界創作のための言語モデル

自然言語処理や音声認識などの工学分野で使われ,計算言語学の基礎でもある言語モデルについての基礎的な事項を解説し,実践的な架空世界創作における言語創作への応用を模索していきます.

完成

未完成

  • corpus
    • いくつかのテキストを収録する可能性あり.
      • 主にtoki ponaだが,それ以外も検討.
      • 新語提案と誤り訂正はエスペラントでやるのがいいのかという説がある
        • ただし,使うコーパスを数千文から数万文,語彙を数千語に限らないと,一般の架空言語創作への応用としての利用方法を提示できないので,適切な文のみを精選して条件を満たすコーパスを作る必要がある.
  • tokenizer
    • tokipona tokenizer
      • 最低限の実装のみ完成
  • lm
  • text

About

架空世界創作のための言語モデル

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors