"血をもって書け。そうすればあなたは、血が精神だということを経験するだろう。"

ラジオ語学学習を始める

たとえ続けられなくなるのだとしても、何かを始める、きっかけを作るのに4月は最高の機会だ。 NHKラジオで語学を学ぶことに興味があるなら、特にそうだ。

少し前だとラジオを買って、さらに書店で毎月テキストを買ってきて、になるのだが、 今だとスマホに「らじる★らじる」をインストールすればラジオがなくてもよいし、 マイ語学で過去の分のストリーミングも聞ける。 テキストはKindleアプリが入った端末があれば電子化したものを購読できる。 時代は変わったなあ。

今週のお題特別編「この春に始めたいこと・始めたこと」

〈春のブログキャンペーン 第2週〉

チョムスキー『統辞構造論』メモ

チョムスキーの『統辞構造論 Syntactic Structures(1957)』を読んだ。

第2章 文法の独立性

文法的という概念について。

有名な例文

Colorless green ideas sleep furiously.

は、言語機能が有する、 文法的列と非文法的列を区別する能力 の例として、 以下の文との対比として挙げられる。

Furiously sleep ideas green colorless

文法的な文の集合、 文法的という概念 と、 言語学者が集めた発話コーパス有意味(meaningful)有意義(significant)といった概念、 また高次の統計的近似を同一視することはできない。

言語能力は、 実際の談話においては一度も発話されたことのない語の組み合わせを発話できなければならない。 また統計や意味によらず、どのような文が文法的であり、また文法的でないか、を判断できなければならない。

第3章 初歩的な言語理論

言語は無限であるが、文法は有限である。 形態素の列の単なる一覧表ではありえない(それは有限ではない)。 コミュニケーション理論に基づくモデルが提示される。 始状態と終状態を持ち、エッジとして単語を持ち、再帰的装置としてループも許容する有限状態マルコフ過程としての文法モデル(有限状態文法)が提示される。 言語の統計的構造ではなく文法的構造の研究なので、遷移確率についての一般化には踏み込まない。

有限状態言語では取り扱えない、埋め込みのような文形成プロセスが存在する。

第4章 句構造

馴染み深い置換規則による文法モデルが提示される。

Sentence -> NP+VP
NP -> T + N
VP -> Verb +NP
T -> the
N -> man, ball, etc.
Verb -> hit, took, etc.

この規則だけを適用し、Sentenceという抽象記号から漸次的に具体的な文を生成する有限列 を派生(derivaration)という。

Sentence
NP + VP
T + N + VP
T + N + Verb + NP
the + N + Verb + NP
the + man + Verb + NP
the + man + hit + NP
the + man + hit + T + N
the + man + hit + the + N
the + man + hit + the + ball

より視覚に訴える樹形図で書くこともできるが、派生がもつ「規則を適用する順番」の情報が落ちる。

Sentence - NP - T - the
      `       ` N - man
         ` VP - Verb - hit
              ` NP - T - the
                   ` N - ball

同じ樹形図に帰着する2つの派生を、同値(equivalent)であるというが、 1つの文が同値でない複数の派生を許す場合、構造的同音異義性(constructional homonymityが生じているといい、この文は多義(ambiguous) となる。

有限状態文法で扱えなかったような文が、句構造文法で扱えるようになる。

第5章 句構造による記述の限界

句構造に組み込めない規則群

等位接続

the scene - of the movie - was in Chicago
the scene - that I wrote - was in Chicago

から

the scene - of the movie and that I wrote - was in Chicago

を作ることはできない。これを律するのは、

S1とS2が文法的な文であり、S1においてXが現れる位置に,S2においてはYが現れる(即ち、S1=...X...でS2=...Y...)という点でのみS1とS2が異なっていて、かつ、S1とS2各々においてXとYが同一の種類の構成素であるならば、S1におけるXをX + and + Yで置き換えた結果生じるS3(即ち、S3=...X + and + Y...)は文である。

という規則であり、例は前提の後半(同一の種類の構成素)を満たさない。 この規則は2つの意味において根本的に新しい。

  • 句構造文法の各規則は、派生の各段階での最終状態しか要求しないが、問題の規則は派生の履歴を参照できることを要求する。
  • 句構造文法の各規則は、単一記号の置換であるが、問題の規則は2つの文を同時に参照できることを要求する。

助動詞句

句構造文法は、助動詞句(have...enbe...ing)をうまく扱うことができない。助動詞句は不連続要素複数語に渡って扱われる要素)であり、さらに倒置を扱えることを要求する。

受動と能動

S1がNP1 - Aux - V - NP2という形式をもつ文法的な文であるならば、それに対応するNP2 - Aux+be+en - V - by+NP1という形式の連鎖もまた文法的な文である。 この規則は文法の大幅な単純化を可能にするが、句構造文法の限界を大きく超える。

これらの句構造の限界を踏まえ、句構造(Phase structure) + 変換構造(Transformational structure) + 形態音素論(Morphophonemics) の3つのレベルに分かれた文法モデルが提示される。

句構造のレベルに対応するものとして、文法はX -> Yという形式を有する諸規則の列を持ち、それより低次のレベルに対応するものとして、同じ基本形式に基づく形態音素規則の列を持つ。これらの2つの列を繋ぐものとして、文法は変換規則の列を持つ。

変換レベルの規則群の性質

句構造レベルから分離された変換レベルの規則群は、以下のような性質を有する。

  • 変換の適用には順序を定めなければならない。
  • 変換は、派生が文となるために必ず適用される義務的(obilgatory)なものと、そうではない随意的(optional)なものに二別される。助動詞句に関する変換が前者、受動・能動に関する変換が後者となる。義務的変換のみを適用して得られる文を核文(kernel sentences)、その集合を核(kernel)という。

第6章 言語理論の目標について

前の3章において

  1. 有限状態文法
  2. 句構造
  3. 句構造と変換規則の組み合わせ

の順に文法モデルの修正が行われてきたが、この全体的なアプローチに対する説明が行われる。正しい文法を選択するための基準を開発し、明確化することを目標とする。

  • 文法は妥当性の外的条件(exterenl conditions of adequacy)を満たす必要がある。

    その文法によって生成された文は、母語話者にとって容認可能でなければならないだろう。

  • 文法は一般性の条件(conditions of generality)を満たす必要がある。

    所与の言語文法言語構造に対する特定の理論に則って構築されなければならず、また、その理論においてはいかなる個別言語とも独立に「音素」や「句」といった用語が定義されていなければならないのである。

言語構造の一般理論が、コーパスが与えられたときに個別文法に対して提供できる機能に対して、3段階の要請がありうる。

  1. 発見手続(discovery procedure) : コーパスだけを入力として、文法を構築して出力する方法・装置
  2. 決定手続(decision procedure) : 入力・提案された文法が、入力されたコーパスの源となる言語の最良の文法なのかどうかを決定して出力する方法・装置
  3. 評価手続(evaluation procedure) : 2つの文法が入力・提案されたとき、どちらがコーパスの源となる言語のよりよい文法なのかを選択する方法・装置

評価手続が最も弱い要請である。そして(従来の言語理論の目標と異なり)チョムスキーの考えでは言語理論が満たせる最大限の要請である。

文法の評価・選択を行うために例えば単純性(simplicity)のような基準を用いる場合、3つの課題がある。

  1. 「文法の妥当性に関する外的基準を(もし可能ならば、操作的、行動的テストも含めて)精密に述べる」こと。
  2. 「文法の形式を一般的かつ明示的な形で特徴付け、その結果その形式を持つ文法を個別言語に対して実際に提案」すること。
  3. 「適正な形式を持つ文法間の選択にあたって我々が用いようとしている単純性の概念を分析し定義」すること。

第7章 英語におけるいくつかの変換

導入された変換規則の具体例の解説に入る。 周知の英文法をなるべく少ない原理で記述しようという試みに魅力を感じる人も多いとは思われるが、 本書全体の流れに影響する新しい概念はないように思われるため詳細は割愛する。

核の構造

英語の文の核は、単文であり、平叙文であり、能動文であるような文の集合であり、それ以外の文は変換体として核の外に置かれる、という直感とあまり矛盾しない結論が示される。

例えば受動文を核文におき能動変換というものを考えることにすると、

John was drunk by midnightという文はmidnight drank Johnという非文を生むことになり不要な困難が生じる。

変換の議論の利得

構成素構造を確定するための基本的な基準の極めて多くは、実のところ変換に基いているものである

ため、 変換のもとでどのような文が文法的であるかを議論することで文の構成素構造の確定を助けることができる。

例えば

John knew the boy studying in the library
John found the boy studying in the library

という一見同じ構造をとる二文のうち、後者は

the boy studying in the library was found(by John)
the boy was found studying in the library (by John)

の二つの受動変換を許し、多義性を有することがわかるが、前者は第一の受動変換のみを許す。また

John came homeという文はhome was come by Johnのような受動変換やWhat did John comeのような疑問変換を許さないため、NP-Verb-NPという分析は退けられる。

第8章 言語理論の説明力

我々が示唆していることは、「文を理解する」という概念は、言語学的レベルという概念に基いてある程度説明されるべきであるということである

文法が文の構造に備わる類似性や多義性、分類という問題に対処するには、 それぞれの問題に応じた言語学的レベルを扱える必要があることを例示する。

形態論レベル

a namean aimの音素列上の多義性(構造的同音異義性)を説明するためには、 音素のみを扱うレベルのみではなく 形態論的表示のレベルを扱う文法モデルが必要である。

句構造レベル

John played tennis
my friend likes music

の構造的な類似性や

they are flying planesの多義性を説明するには、 語や形態素のレベルを超えた、句構造のレベルを扱うモデルが必要である。

変換レベル

I found the boy studying in the library の2つの解釈は、どちらも同じ核文に由来する。

I found the boy
the boy is studying in the library

これを説明するには2通りの変換を扱う必要がある。また

the shooting of the hunters

の多義性は、句構造レベルではthe V ing of NPとなってしまうので扱えず、

the hunters shoot
they shoot the hunters

という2つの核文からの変換として扱う必要がある。 これらの多義性を説明するには変換のレベルを扱うモデルが必要である。

さらに、文法が

John ate an apple (平叙文)
did John eat an apple (yes/no疑問文)
what did John eat (WH疑問文)
who ate an apple (WH疑問文)

という直観的な分類をサポートするには、語順やイントネーションではなく、やはり変換のレベルでの分類を考える必要がある。

第9章 統辞論と意味論

最もexcitingでcontroversialな章であるかもしれない。 統辞論に対しては、言語の意味的側面を無視したとする批判が多い印象がある。 チョムスキーも「危険な領域」に踏み込んでしまうことを認めながら、慎重に意味論者への反論を展開する。

確かに「言語形式についての直観」が言語形式(即ち、文法)の研究者にとって非常に有用であることは否定出来ない。また、文法理論の主要な目標が、こういった直観への曖昧な依拠を厳密で客観的なアプローチをもってして置き換えることであることも、また極めて明確である。しかしながら、「意味についての直観」が言語形式を実際に研究するにあたって有用であることを示す証拠はほとんど存在しない

わかりやすい例を3つ選ぶ。

音素的弁別

意味論者のテーゼのうち、 最も紙面を割いて反駁されるのは以下のものである。

2つの発話が音素的に弁別(phonemically distinct)されるのは、それらが意味においても異なるとき、かつその時に限る。

同義語 synonyms(音素的に弁別されるが同一の意味を有する発話トークン)、同音異義語 homonyms(同義語の逆)の説明ができない。 *1

あるトークンと同一の音声表記をもつ全てのトークンの意味の集合をそのトークンの多義的意味と定義し、音素的弁別を多義的意味における弁別と同一視すれば、同音異義語の問題は(同様にして同義語の問題も)解決するかもしれないが、困難である。 意味的アプローチは、どういう条件で2つの意味が同一であるのか、あるいは類似しているだけで同一ではないのか、を定義する必要がある。 トークンの意味を「このタイプのトークンが使われる用法や状況の集合」*2や「このトークンが喚起する反応のタイプ」として同一性の検証を行う必要があり、 もとの問題よりも難しい弁別の問題を引き起こすのである。

幸いにも音素的弁別を確定するために意味的アプローチよりも「すっきりとした操作的アプローチ」が存在する。 あるインフォーマントが弁別的に発話した2種類のトークンを、別のインフォーマントが一貫して識別可能であるかどうかをペア・テストするだけでよい。 ここにはインフォーマントの反応に関する問題は存在するが、意味に関する問題は存在しない。

形態素と意味

形態素は意味を有する最小の要素である。

I want to gotoが、独立した意味を持つとは考え難い。また、「gleam(きらめく)、glimmer(ちらちら光る)、glow(白熱する)におけるgl-のような非形態素にもある種の意味が与えられる」とすると、この命題の反例となる。 *3

能動と受動

能動文とそれに対応する受動文は同義(synonymous)である。

量化の現象を考えた場合、 everyone in the room knows at least two languagesという能動文は、 それに対応する受動文at least two languages are known by everyone in the roomと同義ではない。

形式的特徴と意味的特徴

先の批判に関して、 本書によれば、 (8章でみたように) 形式的な言語理論とそれが導く文法の妥当性をテストするために 多義性のような意味的記述を説明できるかどうかを考えることは有効である し、そうすべきである。 が、それは意味文の理解を包摂する言語使用言語形式の関係の問題に含められるべきであり、 7章までの形式的な議論に意味的アプローチの寄与するところはない。

主語目的語の概念には構造的意味が付されるというよりは、 単に文法理論に属する形式的な要素として扱われるべきである。

註にあるように、

意味の理論が持つ難点の1つは、「意味」という語が、言語に関する未知の面をすべて含む雑駁な用語として用いられる傾向があることである。このことが当てはまる限り、言語に対する他のアプローチが発展するにつれて、意味の理論の諸々の側面が、それらのアプローチに取って替わられることが充分に予想されるのである。

メモ

2月以降色々な機会で生成文法に触れることが増えたので、一度ちゃんと読んでみようと思ったのがきっかけ。 それほどボリュームはないが、何が書いてあるのかを丁寧に読むのはしんどかった。

本書の出版は1957年であり、それ以降の通史的な流れの概観には以下の書籍を併読するほうがよさそうだ。

岩波講座 言語の科学〈6〉生成文法

岩波講座 言語の科学〈6〉生成文法

また伝統文法、構造主義文法、認知言語学のような前後のパラダイムも追って勉強していきたい。

*1:タイプトークンという概念はとくに説明なく出てくるがおそらくパースによるものであり、ソシュールのラングとパロール、あるいはオブジェクト指向におけるクラスとインスタンスの概念に近いと考えてよさそうである。

*2:ラッセルだったか誰だったか、自然数の2を「要素が2つある集合の集合」としての定義を試みたのに似ている。

*3:認知意味論研究 』(山梨)p.112などに多くの類似事例が挙がっている。例:blow-blaze-blizzard-blast, babble-bubble-pebble-ramble-stumble

徒然 2014/03/29

3/28

3/26

  • Rのこの挙動でハマる。NAを期待した。
> sum(c(NA,NA),na.rm='T')
[1] 0
  • 広域探索しながら最急降下でパラメータ最適化するモデルを作る。食事中も計算し続けるので、時間を有効に使えている気分。
  • データ処理からawkとかmysqlを外してR 一本にする。

3/25

  • 千代田区図書館の会員証をつくる。
  • 無限インパルス応答と有限インパルス応答の勉強をする。
  • MATLAB向けのよさそうな演習を発見。Rでもできそう。

3/24

3/23

英語の仮定法現在について(東京言語研究所 集中講義)メモ

東京言語研究所集中講義を聞いてきたのでメモ。

講師は津田塾大学名誉教授の千葉修司氏。

仮定法(接続法)

動詞の法(mood)の一つ。日本では用法を汲んで仮定法と訳しているが、 欧米では古典ギリシア文法からの訳の経緯で接続法(英subjunctive, 仏subjonctif, 独Konjunktiv)と呼ぶ。

仮定法現在

英語教育では、仮定法過去/過去完了が主に反事実を表すのに対し、仮定法現在は主に祈願や要求を表す、となっている。 主語を問わず動詞の原形が現れる。直説法の場合は三単現のsが現れるなど活用するので区別できることが多い。

God save the Queen!

The employees have demanded that the manager resign.

仮定法現在の認可(license)

基本的に仮定法現在を認可する動詞、名詞、形容詞は限られるが、状況によって認可する語もある。

?The widow wrote that Ball be given part of her property.

The widow wrote in her will that Ball be given part of her property.

writeは原則的には仮定法現在(be)を認可しないので、第一文はインフォーマントによっては不自然と判断されるが、第二文は「遺書の中で」という状況が付与されたことにより仮定法現在が認可される。

また、Neg(否定詞)やQuantifier(量化詞)の機能範疇、あるいは単に話者の思考によって接続法を認可する言語がある。

Teresa no cree que Miguel viene hoy.(直説法。ミゲルが来ないことが話し手には確実)

Teresa no cree que Miguel venga hoy.(接続法。ミゲルが来るかどうかは話し手には不明)

局所性(locality)

現代英語では仮定法の認可は一般にglobalではない。

I demand [ that John answer [ the questions [ that Bill asks (*ask) ] ] ].

demandはanswerを認可するがaskの仮定法は認可しない。

We do not require of theoretical work on intuitions [ that it guarantee [ that the grammar of any one individual be explicit or even consistent ] ].

guaranteeを認可するのはrequireだが、beを認可するのはrequireでなくguaranteeである。

OEやME、アイスランド語・イタリア語・カタロニア語においては二段下の従属節における仮定法が認可されることがある。

動詞繰り上げ(verb raising)と一致(Agreement)

現代英語の仮定法でNegやQuantifierなどの副詞がある場合、Vの前に来ることが多い。

I insist that John not come so often.

John required that they actually be / *be actually accepted.

John required that they all be / *be all accepted.

John demanded that the boys each be / *be each given five dollars.

I insist that he definitely have / *have definitely finished by tomorrow.

一方、OEではVがNegの左へ繰り上げされる。

I wish I be not now proud indeed!

現代英語でも起こるが、仮定法の一部(be/have)や、直説法の助動詞(doを含む)に限る。

I demand that he have not left before I return

語順に関して通時的にはNeg-First PrincipleとEnd-weight PrincipleのバランスによりNegative Cycleと呼ばれる変化が見られる。(Jespersen 1924など)

ic ne secge.

I ne saye not.

I say not.

I not say.

I do not say.

I don't say.

これらの語順はAgreementと関係する可能性がある。 OE(仮定法も単複別形Sg. ride - Pl. riden)ではAgreementが強いのに対し、現代英語では弱い(とくに仮定法では一律原形であり、Agreementは存在しない)。

コーパスの罠

講師は、繰り上げしない仮定法現在が英語で広まったのは1940年代以降とコーパスから推定しているが、失敗談が興味深い。 コーパスでnot+動詞原形の形式を検索したところ、より早い時期の例が見つかり、初め誤って推定をしていたという。 一つは黒人英語でみられるinvariant be(不活用のbe)であった。これが1840年代の白人の英語にどの程度の影響を与えたのか、など調べると面白いかもしれない。 もう一つはMark Twainの小説The Jumping Frogで、この小説は英語原著、仏語訳に加え「作者による仏語訳からの輸入訳」の三訳があり、輸入訳がマッチしたのだ。

...and possible that you not be but an amateur.

もとの仏訳は以下の通りだった。

...et possible que vous ne soyez qu'un amateur.

また、直説法と仮定法で語形が一致してしまう主語をもつ場合はコーパスでの機械的な判別は難しそうだ。主語によるバイアスを調べてみるのも面白いかもしれない。

縮約(contraction)とTense

仮定節ではcontractionが起こらない。

She insists that they have completed the job by 10:00 today.

*She insists that they've completed the job by 10:00 today.

contractionの有無を決めるのは何か。 キーになるのはTenseであると考えられる。

Aux -> Tense (Modal) (have-en) (be-ing) という分解においては、 Tenseを受け取るのはその直後にある要素となる。

直説法において、Modalがない場合、(have-en)がTenseを受け、contractionが起こる。

I know that they've already left.

ModalがあるとModalがTenseを受け、(have-en)のcontractionが起こらない。

You must have not been listening.

*You must've not been listening.

仮定節にはTenseがないのでcontractionが起こらない。

ただ、 口語の場合はいろいろと原則から外れ、 非標準的な形態からの縮約が発生する。

If I'd've met you earlier I wouldn't've married Louise.

Stowell(2008)the English Konjunktiv II(ドイツ語接続法第二式の英語版)としてhad've saidおよびその表記としての had of said,had a said を挙げる。 これを認めるかは話者による。 言語が生き物であるという好例だろう。

So help me God!

soの理解が難しい。 「神にかけて」というニュアンスでいろんな用法で使われる。so helpが縮約しswelp/s'welp/s'elp/s'help(OED)という語もあるくらい頻出。祈願を表す仮定法現在に先立つすることがある。 古くはifの意味で使われたため仮定法現在と共起することがある。(so please you(=if you please))

So he be safe he cares not what becomes Of King or Country. (Marlowe, The Massacre at Paris) 彼は自分が生き残るのであれば王や国がどうなろうと知ったことではない。

能格・対格

少しテーマからそれるが、「仮定法現在もどき」の一パターンということで。

"A Daniel come to Judgement! yea, a Daniel!" (Shakespeare, The Merchant of Venice)

このcomeは仮定法現在と混同されやすいが直説法で、which(現代だとwho) is + come(過去分詞)の省略。現在分詞のwhich isが落ちるのと同様。 aがついているのは「Danielのような人」という用法。

能格の概念はそれなりに重要な気がするのだが、大学受験では習わないので馴染みがない。 PullumやPerlmutterのrelational grammerで、他動詞が能格(ergative)名詞と対格(accusative)名詞の2つをとるのに対し、どちらかが落ちると自動詞となり、それぞれに名前が付いている。名詞というよりは、相補する名詞を失った名詞、もしくは動詞の機能に応じて命名されているように見える。それぞれ日本語訳は逐語的に非対格動詞、非能格動詞となっているが、混乱しやすい。

  • unaccusative verb
    • accusative(対格)が残り、ergativeが落ちる。
    • appear,arrive,arise,come,depart,enter,fall,flee,fly,go,land,return,ride,rise,run,spring,vanish
  • unergative verb
    • ergative(能格)が残り、accusativeが落ちる
    • bark,cough,cry,belch,grin,growl,sleep,smile,speak,swim,talk,vomit,weep,whisper

unaccusative verbの場合、上の例文のように、他動詞文の対格の名残で現代でもbe+過去分詞の形をもつものがある。*1 (それを言語機能が過学習しているのかはわからないが) 第一言語習得でも第二言語習得でも、過剰に受動形をつくるエラーが起きやすい。

自動詞・他動詞の形態の関係も調べると面白そうだ。

  • rise(自)-raise(他):米語
  • raise(自)-raise(他):英語
  • open(自)-open(他)
  • あく(自)-あける(他)

ロジバンでは項の構造はどう整理されていたかが気になる。

感想

講義演題が「ことばの観察を通して心を探る」とありどういう内容なのだろうと思っていたが、認知モデルとしての文法機能の仕組みを例文から明かすという生成文法的な考え方の勉強になった。

講師は学生時代にMITでChomskyの講義を受けたり議論をしたりしたそうで、生成文法が黎明したホットスポットの熱狂が端々に伝わってきたのもよかった。 生成文法以前の伝統文法における動詞の分類とrelational grammerにおける分類の関係が講義中話題になった。 伝統文法にも、生成文法の規則群に縛られない貴重なデータがたくさん眠っているそうだ。

若いころの通訳体験や最近の映画、ドラマから専門コーパス、インターネットの一般サイトに至るまで様々なソースから膨大な文例を蒐集し、またそれについてのメモをDropboxにを全て保存して日常的に更新を続けられており、御歳に負けず最新のテクノロジーに馴染もうとされているのが、大変印象深い。

*1:高校英語では、「往来発着」の動詞として説明される。

Google books Ngram Viewerで言葉の登場頻度推移を調べる

Google books Ngram Viewer
データの精度の確認やグラフの解釈が結局必要にはなるが使いようによっては参考になるかも?


Institute for Advanced Studyは日本語でいうプリンストン高等研究所。安定している。

1940-1980年の落ち込みはなんだろう。



この場合1990年代まで約150年かけて逆転が起こっている。