トップ 差分 一覧 ソース 検索 ヘルプ PDF RSS ログイン

SKK用語集

Wiki に独立した項目を立てるほどでもない個々の用語を集めるページです。思い付いたら何でも追加していって下さい。

議論が必要になったら適宜別項目にすると良いでしょう。

用語集

 SKK全般

DDSKK

DareDevil SKK。本来の SKK としての機能性を損わない限りで積極的な拡張を是認する開発方針からこう呼ばれています。新しい革袋には新しい葡萄酒を、DareDevil な SKK には DareDevil な 辞書を ;-)

ただし、

  • DDSKK の辞書は他の SKK 実装や関連プロジェクトでも利用されていること
  • 従来の SKK やその辞書も CVS などからいつでも入手可能であること

の双方は視野に入れておく必要があります。

各辞書、特に[SML]辞書は SKK 互換の辞書を前提としているプログラムでそのまま、もしくはそれが無理でも一定の加工(SKK-JISYO.L.unannotated がその代表例)によって使えるよう配慮する必要がありますし、他の IM などでの応用もある程度は考慮しておくべきです。SKK の辞書も、他のプロジェクトからの恩恵を多分に蒙っているわけですから。

ML

単に「ML」と言った時には、SKK Openlab Mailing Listのことを指します。

SKK-JISYO.MLの方は「ML辞書」と呼ぶのが無難でしょう。念のため。

MLは辞書だけではなく、DDSKKの開発や、その他SKK全般に関する議論を広く行う場です。辞書の編集方針についても、個々の語のレベルを超えた大域的な話についてはここで提案・議論するのが良いでしょう。ここに蓄積された議論はL辞書の財産とも言えるものです。

MLアーカイブ:

 エントリ/ペア/候補/見出し

こい /恋/鯉/故意/請い/戀/濃/湖衣/

見出し、見出し語、key (「こい」)
変換前の、ユーザが直接入力する文字列です。
候補、単語、candidate (「恋」「鯉」「故意」……)
変換結果として出力される個々の文字列です。candidate(s) として数えられます。
ペア、pair (「こい /恋/」「こい /鯉/」)
見出しと単語の、一対一の対(つい)です。候補が一つだけのエントリとも見做せます。フォームに入力するのはこの「ペア」ということになります。
エントリ、entry (「こい /恋/鯉/故意/請い/戀/濃/湖衣/」)
一つの見出しと、それに対応する全ての候補のセットです。辞書ファイルの一行が一つのエントリとなります。entries として数えられます。
現在のL辞書は 151098 entries, 205035 candidates です。
151098 keys, 205035 pairs とも言えます。

 okuri関連

okuriと送り

okuri-ari エントリで指定する「送り」のアルファベットを特に okuri と呼んでいます。

しk /敷/如/若/及/

であれば、"k" が okuri、「か」「き」「く」「け」「こう」などが「送り」ということになります。

okuri-nasi, 送り無し

のあそび /野遊び/

のように、送り仮名を含む「送り無し」エントリというものも存在します。

マニュアルでは「送り仮名が無い場合」と記述していますが、実際には活用しない体言は送り仮名を含んだ形のまま「送り無し」として登録されている場合も多くあります。

「送り仮名が無い場合」というよりは、「送り位置を指定する必要がない場合」と考えた方がより適切であると思われます。

ゆうやけ /夕焼け/夕焼/

ゆうやk /夕焼/

のように、両方の形で登録されている場合もあります。

みみなr /耳慣;-れない/耳鳴;-り/耳馴;≒耳慣れない/

みみなり /耳鳴り/耳鳴/

のような場合は、「耳鳴り」は送り無しとして入力した方がスムーズです。

okuri-ari, 送り有り

こちらも、マニュアルには「送り仮名が有る場合」とありますが、「送り無し」の項で見たように「送り位置を指定する必要がある場合」と考えた方が適切なようです。

また、特殊なケースとして

りんt /凛/

みw /見/身/

のように、本質的に「送り」ではないもの(特に、助詞)が "okuri" として付与されている場合もあります。これなしでは、たとえば「凛として」と入力するのはかなり困難になるでしょう。

必ずしも定義にこだわらず、場合に応じて柔軟な対応をした方が結果は良いという例と言えましょうか。

※(setq skk-auto-okuri-process t) とすると境界はさらに曖昧になります。

 語/単語/複合語

単語

採録基準」の、「単語の定義」も参照。ただし、これは一般化できるものではありません。

日本語学では「単語」は漢字一字の語のみで、二字以上のものは全て「熟語」と呼ぶ場合もあるようですが、SKK の場合は、分割すると意味が失われてしまう語は単語と見做して良いでしょう。

複合語

本質的には、漢字二文字以上の語は全て複合語ですが、SKK の場合は「複数の独立語からなる語」と考えておけば良さそうです。

こうてきしきん /公的資金/

こうてきしきんちゅうにゅう /公的資金注入/

「公的」「資金」はそれぞれ単語、「公的資金」は複合語だが一つの語、「公的資金注入」となると複合語かつ一つの語かも疑問、といったところでしょうか。

どうけん /同県/同権/銅剣/洞見/

組成としてはほぼ同じでも、「同権」は一語、「同県」は複合語とも考えられます。

 unique/競合

unique,ユニーク

一つの見出しに対して候補も一つだけであり、全く競合のない状態。

ねこ /猫/

ユニークなエントリ=候補は、存在することで他の語彙が入力しづらくなるようなことが基本的にありません。

競合

こう /公/項/考/孝/功/劫/甲/香/口/校/行/高/広/硬/厚/工/江/港/稿/後/好/光/孔/膏/綱/鋼/講/侯/候/抗/航/斯う/乞/国府/向/巧/降/絳/酵/哮/吼/拘/佝/怐/鉤/鈎/勾/宏/浤/紘/肱/鉱/砿/昿/絋/弘/交/効/絞/郊/鮫/傚/咬/效/狡/皎/蛟/佼/餃/鵁/耕/畊/耗/更/梗/哽/峺/荒/慌/縞/敲/犒/稾/鎬/槁/塙/藁/嚆/垢/后/詬/逅/幸/倖/睾/恒/恆/亙/亘/構/溝/購/冓/媾/搆/篝/覯/遘/坑/杭/亢/伉/吭/頏/控/腔/倥/啌/椌/箜/紅/虹/扛/矼/缸/肛/訌/鴻/桁/絎/攻/攷/洪/哄/閧/鬨/岬/匣/呷/狎/胛/閘/浩/皓/晧/窖/誥/靠/皇/凰/徨/惶/湟/煌/蝗/遑/鍠/隍/晃/幌/滉/恍/晄/洸/絖/胱/昂/仰/貢/槓/熕/袷/恰/閤/蛤/峇/洽/鴿/康/糠/慷/鱇/喉/猴/盍/溘/闔/黄/壙/廣/曠/礦/簧/鑛/黌/叩/釦/扣/肯/肴/淆/肓/皐/皋/杲/昊/槹/寇/冦/蚣/撹/興/巷/庚/衡/膠/嫦/汞/烋/爻/磽/纐/羔/耿/薨/鏗/尻/岡/崗/剛/棡/格/神/嵩/昴/頁/河/衝/湊/

こうしょう /交渉/公称/高尚/考証/校章/公証/工商/鉱床/工廠/哄笑/口承/厚相/工匠/公章/公傷/咬傷/高承/公娼/行賞/高唱/後章/口誦/好尚/洪鐘/巧匠/康正/光昭/

その対極が、このように競合の激しいエントリです。

重要な語彙はどれだけ競合が激しくても採録せざるを得ませんが、複合語などでそれほどでもない場合は、ユニークであるか、そうでなければどのくらい競合があるかも多少考慮する必要があります。

競合の解消

また、入力単位を大きく取ることで、unique でない語彙を unique かそれに近い形で決定できる場合があります。

き /気/木/黄/樹/奇/記/期/器/機/基/忌/生/鬼/貴/旗/危/着/来/騎/紀/季/既/規/軌/帰/企/己/起/杞/祈/圻/棄/弃/輝/揮/揆/癸/幃/諱/愧/餽/窺/槻/亀/龜/耆/鰭/詭/跪/旡/曁/毅/毀/燬/幾/畿/饑/飢/几/机/肌/熙/煕/熈/羇/羈/覊/匱/櫃/瞶/饋/伎/妓/岐/跂/汽/愾/气/氣/喜/嬉/僖/憙/熹/禧/希/稀/唏/晞/欷/欹/棋/棊/碁/其/箕/朞/淇/祺/稘/騏/麒/冀/驥/寄/碕/剞/竒/崎/嵜/掎/畸/綺/徽/祁/卉/喟/屓/悸/暉/枳/榿/麾/虧/覬/譏/逵/馗/姫/城/酒/噐/來/徠/皈/歸/聞/倚/猗/

とm /止/泊/富/留/停/冨/畄/

やm /止/辞/病/已/熄/罷/辭/

「き」も「とm」も「やm」も unique からは程遠く、「気に留めない」や「気に病む」はなかなか入力しづらいですが、

きにとm /気に留/

きにやm /気に病/

きにやn /気に病/

というエントリを作ってやることで、"KinitoMenai" のようにしてスムーズに一度で入れてやることができます。

ききいっぱつ /危機一髪/

も、"Kiki Ippatu " と入れるよりも "Kikiippatu " と入れた方が迅速・確実で、「危機一発」のような typo の虞れもありません。

unique なエントリは大変に機能的かつ邪魔にならないので、熟した表現については、文法的な「語」の単位に拘泥らず上手に採録してやれば辞書側の工夫だけでもかなり SKK の性能を高めてやることができます。

なお、この問題への elisp 側からのアプローチもあります。DDSKK をご利用の方は是非お試し下さい。

  • 「『あぶない』の『きき』!」("Kiki;abuNa")で「危機」を出せる――skk-hint.el
  • 直前の確定から候補を絞り込む(「『気』の後だから『留』かな?」)――skk-study.el
  • そこまでの文脈から確率的(bayesian)に候補を絞り込む――skk-bayesian.el

 その他

ヒット数

サーチエンジンのヒット数は、ある語が実際にどのくらい使用されているかの有力なメルクマールの一つとして利用されています。

口語と文語

「口語」と「文語」という言葉の対には二通りの使われ方があり、注意が必要です。

1. 口語 = 現代文法・現代語 ⇔ 文語 = 古典文法(平安文法)・古典語
「給ふ」は文語、「下さい」は口語であると言うときはこちらの意味です。
2. 口語 = 話しことば ⇔ 文語 = 書きことば = 文章語
「爺ちゃん」は口語、「祖父」は文語と言うときはこちらの意味です。
2'. 口語 = くだけた話しことば ⇔ 改まった話しことば
「取んないと」が「口語的」と言うときは、話しことばの中でも特にくだけた(brokenな)ものということで、必ずしも「文語」に対立するものではありません。

SKK辞書には、まず現代の標準的な話しことばと書きことば(日常語=平成言文一致体)を不自由なく入力できるだけの語彙を提供し、その上で、くだけたことばや古風なことば、あるいは方言や特殊な用語の入力も可能な範囲で入力できるように整備することが求められていると言えましょうか。

こう書くと単なる網羅主義のようですが、現代の標準的なことばとそれ以外のことばとが辞書の中で対立するような場合は、基本的に前者が優先されるべきであるということです。たとえば、(擬)古文や漢文をフルに書こう、という目的をL辞書のみで実現しようとするのは現実的ではないでしょう。日常語の入力の延長線上で、「このくらいはL辞書にも入っていた方が便利だ」というくらいのものまでに対応すれば充分と思われます。

abbrev

"abbrev" は "abbreviation" の abbreviation で、略語入力を意味するはずですが、実際には / で入力する英数文字を見出しにしたエントリ全般をこう呼んでいるようです。(逆に、仮名を見出しにした略語ペアは、abbrev とは呼ばず単に略語ペアや連想ペアと呼んでいます。)


最終更新時間:2011年04月11日 04時54分51秒