Perl・sortf・秀丸エディタを用いた用法分析の一例

    田野村忠温・服部匡・杉本武・石井正彦『コーパス日本語学ガイドブック』の87-96ページに収録したものです。
    

  添付CD収録プログラムの改訂版(オリジナルのkw.plは動作しません)
    下記のファイルをデスクトップその他の適当な場所にダウンロード(=保存)してください。次にそのファイルをダブルクリックすると、中にjperlインストーラがあります。
     ガイドブックの87ページの説明のとおり、インストーラを実行してC:\jperlあるいは他の適当な場所にインストール(=解凍)してください。64bit版のWindowsでは動作しません。

    hattori.zip →添付CDのhattoriフォルダの改訂版です。
      2007. 9. 6 kw.pl修正。添付のsortf、長いファイル名対応の版を入れなおし。
      2007.11.29 sibori.pl修正(拡張子のないファイル名に対応)、bunrui.pl修正(ファイル名として不適切なラベルへの対応)
      2007.12. 2 bunrui.pl修正(書き込み禁止ファイルに対応したラベル等への対応)
      2007.12. 15 bunrui.pl小修正(異常終了時のテンポラリファイルの掃除)


   bunrui.plの、入れ子式ラベル対応版 bun1.pl  説明
      2007.12.5   公開
      2007.12. 8   小修正(0という名前のラベルに対応)
      2007.12. 15  小修正(異常終了時のテンポラリファイルの掃除)

     

kw.plについての補足説明
      このプログラムの、というよりは、正規表現を用いた処理に広く当てはまる ことですが、検索対象文字列中に正規表現とマッチしうる部分が二通り(以上)あって、しかも、
      それらの間に互いに重なりあう部分があるという場合には、その うち「最左最長」の一種類しか得られません。
      なお、Perl 6では、overlapping match、exhaustive matchというオプシ ョンが設けられ、すべての可能性が得られるようになるそうです。  
      (http://search.cpan.org/~dconway/Perl6-Rules-0.03/Rules.pmの情報より)



 ホームに戻る

     

Asakawa Kohji / CC BY 4.0