リンク集
SKK 辞書編纂に関連したサイトのリンク集です。良いサイトやリソースがありましたらどんどん追加をお願いします。
SKK
- SKK Openlab
- SKK Openlab は SKK 原作者・佐藤雅彦教授の後を引き継ぎ、SKK 開発の主体となっています。辞書の開発もこのプロジェクトの一環として行われています。
- 辞書登録・削除希望単語入力フォーム
- SKK 辞書の加除編纂への協力を広く募るためのフォームです。現在の辞書に欠けている語・収録されているおかしな語などを手軽に報告できます。
- SKK 辞書 Wiki
- 今お読みのこの Wiki です。フォームや ML での議論をまとめ、発展させ、辞書の編集方針を形成してゆくことが最大の目的です。また、フォームのバグや、量的・内容的にフォームでは困難な辞書編纂希望の報告場所としてもご利用下さい。
SKK派生プロジェクト
- 各種 SKKサーバの紹介
- SKKサーバの実装は無数にあるようで、個々の紹介は出来ませんが、幸い各種サーバを比較・紹介した優れたページが複数ありますのでそちらを紹介しておきます。
- skkime's page
- windows上でのSKK入力を可能にしてくれるソフトウェアです。windows版のskkinput。Windows9x版とWindows2000/XP版があり、後者は活発な開発が行われているようです。
- iiimf-skk
- emacsの外でも快適なSKK入力を実現してくれるモジュールたち。単純な再現にとどまらず、それぞれに特性や特長を持っているようです。
SKK関連プロジェクト
- 辞書共通化(DIXCHANGE)
- オープンソースの日本語辞書を共有化・一本化しようというプロジェクト。現在は活動を休止しているようですが、一連の議論から得られたものは小さくないと思われます。
- KAKASI - 漢字→かな(ローマ字)変換プログラム
- 文字通り、SKK の逆をやるプログラムです。SKK 辞書を利用しています。
- 形態素解析システム茶筌
- こちらはSKKとは直接関係ありませんが、附属の ipadic は極めて有望な語彙リソースです。
- MeCab: Yet Another Part-of-Speech and Morphological Analyzer
- 茶筅から派生した形態素解析器です。連文節変換も可能(!)な SKK server としても動作します。
- Migemo: ローマ字のまま日本語をインクリメンタル検索
- SKK 辞書を利用しています。標準ではL辞書からmigemo辞書を作成するようですが、代わりにML辞書を使用すると高速かつ程良いヒットが得られるようです。
- POBox - 予測と曖昧検索にもとづく入力手法
- SKK辞書との親和性が高いIMの一つで、SKK辞書→POBox変換用のスクリプトも用意されています。交換形式辞書データが404になっているのは残念。
- 予測入力システム: PRIME
- POBoxに似た入力システムです。SKK server としても利用できます。辞書はL辞書がベースの一つになっているようです。
Openlab 以外で配布されている各種辞書
- 北極三號
- 舊假名舊漢字をSKKで入力する爲の辭書です。一昔前の L辭書がベースになつてゐるやうで、サイズは 2Mb、ライセンスは GPL です。
- フリーのかな漢字変換辞たち
- 少し古いですが、有用なリンク集です。
- The EDICT Project
- SKK-JISYO.edictの元になった辞書です。その後も語彙数は増加を続けているようです。独自ライセンスです。
- Okinawa dictionary / 沖縄辞書
- SKK-JISYO.okinawaの元になった辞書です。その後飛躍的に増強されました。Public Domainです。
辞書編纂に有益なリソース
サーチエンジン
- goo
- goo は google と同一の検索エンジンを使用しており、利用方法や検索結果にも大きな差はありませんが、google ではヒット数に計上される「似たページ」が goo では除外されているという違いがあります。フォームでの登録・削除希望に自動的に付与される「ヒット数」は goo のものです。他に、大辞林第二版・デイリー新語辞典・EXCEED 英和辞典・EXCEED 和英辞典も提供されており、登録希望の自動コミット判定に利用されています。特に、デイリー新語は同時代的な時事用語に威力を発揮します。
- freshEYE
- freshEYE は googleエンジンではないので、ヒット数検証のセカンドオピニオンとして利用価値があります。特に、googleエンジンでは単純に無視されてしまう「々」などの記号を含む単語はここでないと意味のあるヒット数が出ません。多様性は善、です :-)
- Yahoo
- 基本的にディレクトリ式サーチエンジンなので語の使用頻度を調べる目的にはあまり使えないのですが、ここは極めて有力な辞書サービスを提供してくれています。大辞泉・大辞林・PROGRESSIVE英和/和英・新グローバル英和辞典・ニューセンチュリー和英辞典の全てを部分一致で検索できるのはかなりのものです。大辞林・大辞泉を自動コミットのために利用させて頂いております。
- Infoseek
- Infoseek には、他にない漢字辞書のサービスがあります。単漢字エントリの検証にはなくてはならないものです。また、コンサイス・カタカナ語辞典は abbrev ペアの検証に使えそうです。
文字コードとJIS X 0213関連
Emacs
- The Characteristics and Implementation of JIS X 0213 on Emacs
- JIS X 0213で何ができるか、Emacsではどうなっているかがコンパクトにまとめられています。
- FreeBSD におけるロシア語の利用について
- タイトルはロシア語となっていますが、Emacs 21で多言語環境を構築するための最新の情報が大変わかりやすく整理されています。とりあえず「Emacs 21 Unicode 環境」の通りにやればJIS X 0213の表示にはこぎつけられるでしょう。
- 最新の Mule-UCS があるサイト (Hideyuki SHIRAI's Web page)
- JIS X 0213:2004 対応の Mule-UCS が取得できます。
- JISX0213(所謂第3,4水準漢字)用bdfフォントのページ
- JIS X 0213 対応のビットマップフォントが入手できます。
- Overview of xfonts-jisx0213 source package
- JIS X 0213 対応ビットマップフォントを提供する Debian のパッケージ。ここでは K12-2000 の K12-1 に、K14-2004-1 から変換された 10 文字が追加されており、ソースパッケージにはそのためのパッチ (K12-1-to-2004.patch) が含まれています。
資料
- 非漢字一覧(JIS X 0213)
- 「JIS X 0213:2000で規定する非漢字の一覧です」。JIS3_4 辞書の記号入力ペア作成の参考にさせていただきました。
- jisx0213 infocenter
- jisx0213 の資料集です。JIS3_4 辞書のベースの一つです。
- 異體字轉交流之塲
- Windows用の異体字変換プログラム「異體字轉」のページですが、異体字辞書の配布も行っており、itaiji辞書のベースとなっています。(このプログラムと類似の機能をSKKに導入するといいかも?)
- Unihan database
- Unicode のデータベースです。部首から漢字を捜して各種文字コードを調べられます。部首はいわゆる康煕字典のものなので検索には少しコツが必要です。(草冠は6画になっていたり)
- JISC 日本工業標準調査会
- 嫌がらせとしか思えないほど使いにくいですが、「JIS検索」のリンクからJISをpdfで閲覧できます。文字コード一覧もpdfの画像で提供されているので応用しやすいことこの上なし。
各種情報源
- 新JIS漢字実践情報
- 矢野啓介さんのページです。JIS X 0213のアクチュアルな情報源です。新規更新分は文字符号化blogに掲載されています。Wikiもあります。
- 小形克宏の「文字の海、ビットの舟」――文字コードが私たちに問いかけるもの
- JIS X 0213、特に2004年の改定は単純な文字コードの拡張とは違う意味での問題点も孕んでいます。興味のある方はご一読を。
語彙リソース
- 音訳の部屋
- 数多くの音訳語彙集が集積されています。リンク集も充実しています。音訳サイトには語と読みがセットで掲載されているので、変換辞書のリソースや読みの確認資料として大変重宝です。ボランティアの皆様に感謝。
- 人名録
- 新聞に掲載された著名人名を集積したサイトです。管理者・海道昭恵氏の許可を頂き、こちらから変換した人名データを SKK辞書の一部として配布させて頂いております。jinmei辞書を新鮮に保つ上で、このことから受けている恩恵は計り知れないものがあります。
- 全国の苗字
- 苗字10万種を集積したデータベースです。圧巻、敬服。
- 「女の子の名前辞書」計画
- こちらは11万もの女性名が収録されています。あとは男の子辞書さえあれば……
- 日本郵政公社:郵便番号等のダウンロード
- 日本郵政公社の郵便番号簿はpublic domainで公開されており、SKK-JISYO.geo, SKK-JISYO.zipcode, SKK-JISYO.office.zipcodeの元データになっております。
その他
- 青空文庫
- 近代日本文学の電子テキストを集積した大変に貴重なサイトです。明治〜終戦前後の日本語のコーパスとしての利用価値もあり、google のサイト検索や青空鯰を併用することで「一昔前」の言葉の使用状況を垣間見ることができます。また、明日の本棚はJIS X 0213の典型的な実践例でもあります。
- Wikipedia
- Wiki を利用したユーザ参加型の百科事典サイトです。ここで専門用語の的確な定義や用例を採集できる場合が少なからずあります。
- シソーラス検索
- 同義語、広義語、狭義語、関連語、反義語を検索できます。要 javascript。
- 法令データ提供システム
- 総務省(法務省ではありません)提供の強力この上ないオンライン六法です。
- 法庫
- こちらも充実したオンライン六法全書です。平成九年以降の法規は有料です。e-gov と違って、google の検索でヒットするので重宝します。
- 文化庁・国語政策情報システム
- 日本語の表記に関する内閣告示・内閣訓令、及びその他の参考資料を閲覧できます。
最終更新時間:2010年08月18日 16時46分57秒