Derivazioni: Space for communication by TANAKA Sigeto
[About] [Author] [Archive] [Mobile] [RSS]

 | | 

Network stop (8/31) because of power outage - Tohoku Univ., Aobayama and Kawauti

All network services within sal.tohoku.ac.jp will stop in 2014-08-31 (Sun.), because of power outage.

8/31 (日) 東北大学川内・青葉山キャンパスで停電。外部向けのネットワーク・サービスも使えなくなります。

Related articles


研究生 (2015春入学) 追加募集 (8月31日〆切)

東北大学文学部日本語教育学専修では、2015年4月入学の外国からの研究生について、追加募集 をおこなっています。
http://www.sal.tohoku.ac.jp/nik/daigakuin/kenkyusei.html


8月31日締切です。自己紹介書・履歴書・研究計画書を電子メールでお送りください。なお、書類選考のほか、電話/インターネットを利用した面談を実施する可能性があります。



Related articles


Skelton: Perl script to visualize syntactic structure of Japanese text

An one-liner JPerl (Shift JIS) script to mask Kanji, Katakana, Greek, and some kinds of symbol characters in Japanese texts.

    jperl -pe "s/[〇ー々0-9A-Za-zァ-ヶΑ-Ωα-ω亜-熙]+/□/g"

Broadly speaking, you can obtain an output containing punctuations, Hiragana, and ASCII characters by processing your text with this script. The following is an example of output:

□から□までのそれぞれの□を□に□す。□に□い□の□が□された□や、□がわからなくなった□などは□を□っていない。それらの□は、□2では、「□せず」の□に□した。□2の「□」の□としては、□の□1879を□の□として□っている。□とも、□した□のなかに、□の□として□となったものが3□ないし4□あった。それらをのぞいた□な□は、□2□ (2010□) では1622、□3□ (2011□) では1555、□4□ (2012□) では1515、□5□ (2013□) では1594であった。□3□と□4□の□がやや□である。ただし、いちばんすくない□4□でも、□は1500□を□できている。

In usual Japanese texts, Hiragana characters always indicate syntactic structure (such as suffixes, particles, auxiliaries, and conjunctions). By contrast, Kanji characters provide substantive meaning (such as nouns, verbs, adjectives, and adverbs). The script accordingly extracts syntactic structure without semantic inference. It thus offers a handy way to evaluate the readability of the text in terms of syntax.


日本語文章の漢字、カタカナ、ギリシャ文字、および一部の記号を □ に変換する簡単な JPerl (Shift JIS) スクリプト。

    jperl -pe "s/[〇ー々0-9A-Za-zァ-ヶΑ-Ωα-ω亜-熙]+/□/g"

これを日本語文章に適用すると、句読点、ひらがな、ASCII文字だけをのこした出力がえられる。 たとえばつぎのような感じである:

□から□までのそれぞれの□を□に□す。□に□い□の□が□された□や、□がわからなくなった□などは□を□っていない。それらの□は、□2では、「□せず」の□に□した。□2の「□」の□としては、□の□1879を□の□として□っている。□とも、□した□のなかに、□の□として□となったものが3□ないし4□あった。それらをのぞいた□な□は、□2□ (2010□) では1622、□3□ (2011□) では1555、□4□ (2012□) では1515、□5□ (2013□) では1594であった。□3□と□4□の□がやや□である。ただし、いちばんすくない□4□でも、□は1500□を□できている。

日本語の通常の文章では、ひらがなは主として統語構造を示すために使われる (活用語尾、助詞、助動詞、接続詞など)。 一方、漢字は、実質的な意味をあらわすことが多い (名詞、動詞、形容詞、副詞など)。 上記のスクリプトは、意味的な推測のきかない状態で統語構造だけを取り出すことになる。 「□の□を□の□として□っている」などのような文を読みあげてみて、構文が即座につかめるかどうかのテストをしてみるとよい。



Related articles


「論文作成の基礎」(金2) レポート提出先

学務情報システム に、現代日本論基礎講読「論文作成の基礎」(金2) のレポート課題を3本出しました。


・期末レポート本体 (PDF) 8/15 (金) 17:00 〆切
・期末レポート「執筆経過」 8/18 (月) 17:00 〆切

のほか、

・中間レポート再提出   8/18 (月) 17:00 〆切

があり、あわせて3つの「レポート課題情報」が出ています。一覧画面では区別がつきにくいかもしれません。提出締切日時などに注意して、まちがえないよう提出してください。

学務情報システムが使えない場合は、電子メールでの提出 でもかまいません。その場合は、受領の返信を送りますので、必ず確認してください。

期末レポートについては http://www.sal.tohoku.ac.jp/~tsigeto/2014/writing/w140627.html
中間レポートについては http://www.sal.tohoku.ac.jp/~tsigeto/2014/writing/w140620.html
をそれぞれ参照

Related articles


現代日本論概論 (火2) 課題返却

現代日本論概論「現代日本における家族」(火2) 最終回を欠席した受講者は、返却課題をひきとりにきてください。
ひきとりにくる日時については、前もって電子メールなどでお知らせください。
返送先が課題に記入してある場合は、8/8に発送します。

Related articles




Recent

Articles

Comments

Trackbacks


Archive

Monthly

Categories [Explanation]

| News:0 || Research:56 || Education:3 || School:257 || School/readu:3 || School/writing:17 || School/family:18 || School/occ:15 || School/quesu:3 || School/statu:3 || School/readg:18 || School/quesg:13 || School/statg:25 || School/kiso:5 || School/study:21 || School/intv:12 || Profile:2 || WWW:7 || WWW/this:4 |