© www.talawas.org     |     về trang chính
tìm
 
(dùng Unicode hoặc không dấu)
tác giả:
A B C D Đ E F G H I J K L M N O P Q R S T U V W X Y Ý Z
Ngôn ngữ
31.12.2003
Trịnh Hữu Tuệ
Chomsky, ngôn ngữ, Quốc Việt ...
 
Trong bài Ai tiếng Việt nào, tác giả Quốc Việt (QV) nói đến những "khác biệt" mà anh nghĩ là "nên khảo sát kỹ hơn" giữa quan niệm ngôn ngữ của Chomsky và của tôi. Bài của QV cho thấy có chỗ tác giả hiểu nhầm về Chomsky. Một phần vì những hiểu nhầm này không phải là hiếm, một phần vì Chomsky cũng là một chủ đề rất đáng được bàn đến trong mục Ngôn ngữ và Dịch thuật, nên trong bài này mục đích chính của tôi sẽ là cố gắng truyền đạt đến người đọc một khái niệm tuy chung chung nhưng rõ ràng và hy vọng là chính xác về lý thuyết ngôn ngữ của Chomsky. Tôi sẽ mạn phép bỏ qua những chi tiết phức tạp trong lý thuyết ngữ pháp để trình bày cái tôi muốn truyền đạt cho thật dễ hiểu. Tất nhiên, lầm lỗi là không thể tránh khỏi, và trong khuôn khổ của một bài viết như thế này thì chắc chắn là sẽ còn rất nhiều câu hỏi phải để bỏ ngỏ. Tôi hy vọng sẽ học được thêm từ những ý kiến phản hồi.

Đầu tiên ta hãy xét tới cái sơ đồ của Chomsky mà QV đưa ra trong bài viết của anh:

(1)     Dữ liệu (data) → cơ quan ngôn ngữ (language faculty) → ngôn ngữ (language) → các diễn đạt có cấu trúc (structured expressions)

Có thể hiểu sơ đồ này một cách nôm na là khi trẻ con học ngôn ngữ, chúng nghe những gì mọi người xung quanh nói (data), dùng khả năng bẩm sinh (language faculty) để hiểu và phân tích những dữ liệu ấy theo một cách nhất định, từ đó rút ra một số kiến thức (language), và những kiến thức đó xác định sự đúng hình thức, i.e. wellformedness, của một tập hợp (vô số) những cấu trúc (structured expressions). Có nghĩa là, trẻ con nghe người lớn nói, suy luận rằng nếu người ta nói thế thì chắc chắn người ta phải theo những quy luật như thế chứ không thể khác được, và biết là nếu cứ theo những quy luật như thế thì còn có thể nói được cả vô số những thứ khác nữa chứ không chỉ những gì người ta đã nói. Những gì trẻ con nghe được là dữ liệu. Cái giúp chúng biết là nếu người ta nói thế thì tức là họ chỉ có thể theo những quy tắc này chứ không phải những quy tắc kia là cơ quan ngôn ngữ bẩm sinh. Có thể coi cơ quan ngôn ngữ là cái common sense của trẻ con khi chúng học ngôn ngữ, cái cho chúng biết được rằng "tất nhiên là phải thế". Những quy luật mà trẻ con rút ra được sau khi tiếp xúc với dữ liệu làm nên cái ngôn ngữ của chúng. Những quy luật này được nội hoá (internalized) và có thể coi như nằm trong "ổ cứng" của não. Với những quy luật này trong đầu, chúng biết được những "diễn đạt có cấu trúc" nào là đúng, là wellformed.

Một điều trước hết cần phải được hiểu rõ là khi nói trẻ con "phân tích" các dữ liệu ngôn ngữ không có nghĩa là chúng làm những công việc của các nhà ngôn ngữ học. Các nhà ngôn ngữ học phân tích các dữ liệu ngôn ngữ một cách hiển ngôn, còn trẻ con thì có thể nói là chúng phân tích mà không biết là mình phân tích, nghĩa là chúng "just do it". Cũng như việc chúng ta nhìn được ba chiều vậy. Một nhà nghiên cứu có thể nói rõ được là đầu của chúng ta phải làm những bước tính toán gì để đi từ hai hình ảnh hai chiều khác nhau trong mỗi mắt đến một hình ảnh ba chiều thống nhất trong não, còn chúng ta thì chỉ biết nhìn ba chiều mà không hề cảm thấy là chúng ta phải làm những bước tính toán nào đấy.

Bây giờ hãy xét từng phần trong cái sơ đồ trên. Hãy xét về phần dữ liệu. Nói cho đúng thì tất cả những gì chui được vào tai một đứa trẻ lúc nó học ngôn ngữ chỉ là những dao động trong không khí, tức là âm thanh và chỉ âm thanh mà thôi. Cái gọi là dữ liệu ngôn ngữ đã là kết quả của cả một quá trình phân tích những âm thanh đó bằng những kiến thức có sẵn nhờ cơ quan ngôn ngữ bẩm sinh. Ít nhất đứa trẻ phải biết được là nên coi cái gì trong số những thông tin âm thanh chui vào tai nó là dữ liệu ngôn ngữ để sau này từ đó rút ra những quy tắc ngữ pháp. Một tiếng hắt hơi hay độ to nhỏ của âm thanh sẽ không bao giờ được coi là những thông tin có thể dùng trong việc hình thành một ngữ pháp sau này. Có thể nói bước tiến lớn trong việc học nói không phải là từ câu nghe được đến quy tắc ngữ pháp. Bước tiến lớn là bước từ âm thanh (noise) đến từ (word). Để học được ngôn ngữ, những khái niệm hết sức trừu tượng như âm vị (phoneme), âm tiết (syllable), từ (word), cấu trúc ngữ đoạn (phrase structure), câu (sentence), phạm trù ngữ pháp (grammatical category), quy tắc ngữ pháp (grammatical rule), ngôn ngữ (language)... đều phải được biết trước, phải nằm sẵn trong não để hướng dẫn quá trình đi từ những gì nghe được xung quanh đến một ngôn ngữ. Một lần nữa xin lưu ý là "biết" ở đây là cái biết tiềm ẩn và bản năng, như biết nhìn ba chiều hay biết là người khác cũng có một linh hồn như ta chứ không phải chỉ là những cục thịt vô hồn đi đi lại lại. Tập hợp những kiến thức bẩm sinh giúp cho đứa trẻ đi được từ những âm thanh lọt vào tai nó đến một ngôn ngữ là cơ quan ngôn ngữ (language faculty).

Nói cách khác, việc một đứa trẻ học ngôn ngữ về bản chất là dùng những giả thiết có sẵn để phân tích dữ liệu và từ đó đi đến kiến thức, một việc chúng ta làm hàng ngày. Ví dụ khi một người đàn ông đi làm về với một bó hoa trên tay để tặng vợ và nghe vợ mình hỏi "tên cô ấy là gì", anh ta sẽ biết ngay là "cô ấy" ở đây chỉ một người bồ tình nghi nào đấy. Những giả thiết giúp cho người đàn ông đó suy luận được ra điều này chắc chúng ta ai cũng biết, và nếu phân tích cho kỹ thì ta sẽ thấy là những giả thiết cũng như quá trình suy luận được óc anh ta thực hiện trong nháy mắt không phải là đơn giản. Điểm quan trọng ở đây là nếu không có những giả thiết ấy thì anh ta sẽ không hiểu vợ mình nói gì.

Tương tự, nếu cái duy nhất đứa trẻ có là những âm thanh hỗn loạn xung quanh nó thì nó sẽ không thể biết được cái gì cả. Ít nhất, nó phải biết trước được là nó và đồng loại của nó có một thứ là ngôn ngữ, một hoạt động là nói. Nó phải biết là khi đồng loại nó nói, họ tuân theo một số những quy tắc nhất định. Nó phải biết là có một thứ gọi là câu, được tạo nên bởi các từ. Hơn nữa, các từ còn có những tính chất khác nhau, tức là thuộc về những phạm trù ngữ pháp khác nhau. Ngoài ra, một câu không chỉ là một chuỗi các từ nối tiếp, mà còn có một cấu trúc, v.v.... Ví dụ, khi học được câu My ăn cơm, đứa trẻ ít nhất phải biết rằng đó là một câu, gồm ba từ, thuộc phạm trù ngữ pháp danh từ, vị từ, danh từ. Khi người ta nói câu đó ra người ta tuân theo một quy tắc có thể dùng để nói cả các câu khác nữa, và nhiệm vụ của nó là phải tìm ra cái quy tắc ấy.

Quá trình tìm ta những quy tắc không phải một quá trình võ đoán. Ngược lại, nó được điều khiển bởi cơ quan ngôn ngữ bẩm sinh. Tức là, mặc dù từ một câu nghe được luôn luôn có thể rút ra nhiều quy tắc khác nhau, nhưng vì quá trình đi từ dữ liệu đến quy tắc được chỉ đạo bởi một cơ quan sinh học chung cho tất cả loài người nên ai cũng rút ra quy tắc theo một kiểu giống nhau. Để minh hoạ điều này, hãy giả sử rằng đứa trẻ, khi học được câu My ăn cơm, giả thiết đó là một câu chứa ba từ My, một danh từ, ăn, một vị từ, và cơm, cũng là một danh từ. Từ giả thiết này nó có thể đi đến một quy tắc nói rằng một câu gồm có một danh từ cộng một vị từ cộng một danh từ. Nói cách khác, đứa trẻ có thể giả thiết cấu trúc (1) trong đầu và rút ra quy tắc (2):

(1)     Câu [Danh từ My] + [Vị từ ăn] + [Danh từ cơm] ]
(2)     Câu = Danh từ + Vị từ + Danh từ

Với quy tắc (2), đứa trẻ có thể nói Khoa ăn cơm, Tùng ăn cơm. Nhưng bây giờ giả sử đứa trẻ học được cụm từ con chó già. Với quy tắc (2), nó sẽ không thể nói được câu con chó già ăn cơm, vì câu này sẽ là Loại từ + Danh từ + Tính từ + Vị từ + Danh từ. Nó sẽ phải học câu con chó già ăn cơm như một câu mới toanh, không liên quan gì đến câu My ăn cơm cả, tức là nó sẽ phải đợi cho đến lúc có người nói con chó già ăn cơm thì nó mới biết là có thể nói được câu ấy, là câu ấy là đúng. Có thể thấy rằng trong thực tế tình hình khác hẳn. Trong thực tế, nếu biết My ăn cơm là đúng, đứa trẻ (hay bất cứ người nào học tiếng) sẽ phải biết là con chó già ăn cơm cũng là đúng. Đó là bởi vì trong thực tế, khi học được câu My ăn cơm, không đứa trẻ nào lại giả thiết cấu trúc (1) và rút ra quy tắc (2) cả. Chúng sẽ giả thiết một cấu trúc như (3) và rút ra một quy tắc như (4):

(3)     Câu [Danh ngữ [Danh từ My]] + [Vị ngữ [Vị từ ăn] + [Danh ngữ [Danh từ cơm]]] ]
(4)     Câu = Danh ngữ + Vị ngữ.

Tức là đứa trẻ phải biết được là câu không bao giờ chỉ là một chuỗi từ đứng cạnh nhau, mà luôn luôn có một cấu trúc. Tính chất cấu trúc của câu có được nhờ khái niệm trừu tượng ngữ (phrase). Một ngữ là một cụm từ có tính chất của một từ nhất định trong cái cụm từ đó. Một danh ngữ nhất thiết phải chứa một danh từ, nhưng có thể chứa những thứ khác nữa bổ nghĩa cho danh từ, ví dụ như tính từ... Một vị ngữ nhất thiết phải chứa một vị từ, và có thể chứa những thứ khác, như bổ ngữ, trạng ngữ... Có thể nói, đứa trẻ phải biết sẵn một cái gì đấy đại loại như (5) và (6):

(5)     Tất cả các quy tắc ngữ pháp đều mang tính cấu trúc
(6)     X ngữ = ... X từ ...

Có thể hiểu (5) là khi đứa trẻ lập những quy tắc ngữ pháp từ những gì nghe được, nó "suy nghĩ bằng ngữ" chứ không phải bằng từ, nghĩa là nó lập thức quy tắc ngữ pháp dùng khái niệm ngữ chứ không phải từ. Nói cụ thể là mặc dù biết từ My là một danh từ, khi nghe câu My ăn cơm đứa trẻ sẽ tự động nghĩ rằng đó là một danh từ nằm trong một danh ngữ. Chỉ khi biết ít nhất (5) và (6) thì một đứa trẻ hay bất kỳ ai học tiếng mới có thể đi từ My ăn cơm đến con chó già ăn cơm được, vì con chó già cũng là một danh ngữ. (5) và (6) có thể coi là một phần của cơ quan ngôn ngữ bẩm sinh.

Có thể nói quá trình học tiếng là quá trình khái quát hoá (generalization) những gì nghe và phân tích được trong môi trường ngôn ngữ để rút ra những quy tắc mà dựa vào đó ta có thể nói những câu mới. Chỉ có điều là sự khái quát hoá này được chỉ đạo bởi cơ quan ngôn ngữ bẩm sinh, tức là không thể khái quát hoá một cách tuỳ tiện được mà phải tuân theo những hạn chế cụ thể do cơ quan ngôn ngữ áp đặt. Ở trên cho thấy quá trình khái quát hoá một câu đơn giản như My ăn cơm không hề "đơn giản" chút nào. Có thể đưa ra những ví dụ khác nữa để chứng minh điều này.

Trong tiếng Việt chúng ta có một quy tắc ngữ pháp, có thể gọi là đề hoá (topicalization). Chúng ta áp dụng quy tắc này để đi từ câu (7a) đến câu (7b):

(7)    
  1. My ăn cơm
  2. Cơm thì My ăn

Khi biết là có thể đi được từ (7a) đến (7b), chúng ta còn biết là cũng có thể đi được từ (8a) đến (8b), thậm chí cả từ (9a) đến (9b):

(8)

  1. Sơn muốn My ăn cơm
  2. Cơm thì Sơn muốn My ăn
(9)

  1. Thọ nghĩ Sơn muốn My ăn cơm
  2. Cơm thì Thọ nghĩ Sơn muốn My ăn

Thoạt đầu nhìn thì thấy quá trình khái quát hoá thao tác đề hoá có vẻ đơn giản, tức là chỉ cần lấy một phần tử trong câu đặt lên đầu câu trước từ thì, để lại một chỗ trống trong câu:

(10)     [Câu . . . X . . . ] ( X thì [Câu . . . ___ . . .]

Quy tắc (10) đúng cho tất cả các câu từ (7) đến (9). Theo nó ta còn có thể đi từ câu (11a) đến câu (11b):

(11)
  1. Sơn đọc [nhiều sách]
  2. Sách thì Sơn đọc [nhiều ___ ]

Nhưng hãy thử theo quy tắc này xem chúng ta còn có thể có những câu gì khác nữa. Từ câu (12a) chúng ta có thể có câu (12b), là một câu sai ngữ pháp - những câu tôi cho là sai ngữ pháp sẽ được đánh dấu #:

(12)
  1. Sơn nổi giận [sau khi My ăn cơm]
  2. # Cơm thì Sơn nổi giận [sau khi My ăn ___]

Và theo (10) thì cũng có thể đi từ câu (13a) đến câu (13b), cũng là một câu sai ngữ pháp:

(13)
  1. [Nhiều sách] sinh ra lắm vấn đề
  2. # Sách thì [nhiều ___ ] sinh ra lắm vấn đề

Xin phép được nói ngoài đề một chút. Có người phản đối với tôi là câu (13b) không phải là một câu sai, vì ta có thể đặt một dấu phẩy giữa chữ nhiều và chữ sinh để có sách thì nhiều, sinh ra lắm vấn đề, một cấu trúc có nghĩa, và nếu một chuỗi âm thanh có thể "hiểu được" thì nó phải là đúng ngữ pháp. Câu trả lời của tôi có hai phần. Thứ nhất, tôi hiểu ngữ pháp là cái nối âm thanh và ý nghĩa. Đúng ngữ pháp, đối với tôi, là một cặp âm thanh và ý nghĩa được nối với nhau theo những nguyên tắc nằm trong một tập hợp những nguyên tắc nhất định (ngữ pháp). Vậy nên khi một chuỗi âm thanh có thể được hiểu theo một cách khác thì có thể coi chuỗi âm thanh đó là một cấu trúc khác rồi. Thật vậy, ta có thể thấy là sách thì nhiều, sinh ra lắm vấn đề là một cấu trúc khác hẳn (13b), gồm hai câu khác nhau. Việc một chuỗi âm thanh giống như (13b) có thể nói được không liên quan gì tới việc (13b) là một cấu trúc sai ngữ pháp. Tôi sẽ nói thêm đến khái niệm "ngữ pháp" và "đúng ngữ pháp" dưới đây. Phần thứ hai của câu trả lời của tôi là "hiểu được" không có nghĩa là "đúng ngữ pháp". Khi nghe (12b), thực ra ai cũng hiểu là người nói muốn nói cái gì, cũng như một người Anh hiểu được câu me no like police. Điều đó không có nghĩa là những cấu trúc này tuân theo những quy tắc của một ngữ pháp nào đấy.

Quay lại với những gì chúng ta đang nói. Có thể thấy rằng sau khi đã học được quy tắc đề hoá (10) của tiếng Việt, chúng ta còn cần phải biết những hạn chế trong việc áp dụng quy tắc này nữa để tránh được những câu như (12b) và (13b). Hãy giả sử là khi ta đề hoá một phần tử nào đó trong câu, ta phải nhấc nó ra khỏi vị trí cơ bản của nó và đặt nó lên đầu câu. Và cũng giả sử là có những thành tố (constituent) trong câu có chức năng như những rào chắn (barrier), ngăn cản không cho nhấc một phần tử nằm trong chúng ra khỏi vị trí của nó. Hãy định nghĩa khái niệm rào chắn như sau:

(14)     Tất cả những gì không phải một bổ ngữ (complement) đều là một rào chắn

Tôi xin được bỏ qua không bàn đến tính chất của vị ngữ, vì sẽ phải kéo dài bài này quá. Hãy coi như vị ngữ không phải là một rào chắn. Theo như (14) thì chủ ngữ (subject) và phụ ngữ (adjunct) là rào chắn, vì chúng không phải là bổ ngữ. Có thể thấy (14) là đúng, vì khi ta nhấc từ cơm ra khỏi phụ ngữ [sau khi My ăn cơm], ta có một câu sai ngữ pháp, cũng như khi ta nhấc từ sách ra khỏi chủ ngữ [nhiều sách] trong câu (13b). Còn sở dĩ (7b), (8b), và (9b) đúng là vì [cơm] là bổ ngữ của ăn, [My ăn cơm] là bổ ngữ của muốn, và [Sơn muốn My ăn cơm] là bổ ngữ của nghĩ, nghĩa là trên đường từ vị trí cơ bản của nó đến đầu câu, [cơm] chỉ phải vượt qua những bổ ngữ mà thôi, không phải vượt qua bất kỳ một rào chắn nào.

Hãy coi như (14) đúng, không nhiều thì ít. Câu hỏi là làm thế nào để biết được (14) qua những gì nghe được từ môi trường ngôn ngữ. Tất cả những câu ta đã từng nghe đều cho phép ta khái quát hoá theo nguyên tắc (10) và không có câu nào trong số những câu ta đã từng nghe có thể cho ta biết được là thao tác dịch chuyển để thực hiện việc đề hoá còn bị hạn chế bởi khái niệm rào chắn. Để biết được khái niệm này, chúng ta phải biết được (12b) và (13b) là sai, tức là phải có người nói cho chúng ta điều đó khi chúng ta học nói. Nhưng không bao giờ có ai nghĩ đến việc nói những câu như vậy cả - trừ các nhà ngôn ngữ học. Những câu đó đi ngược lại với cái common sense về ngôn ngữ của chúng ta. Nói một cách khác, khái niệm rào chắn với chức năng hạn chế những thao tác dịch chuyển cú pháp là một phần của bản năng ngôn ngữ, của cơ quan ngôn ngữ bẩm sinh.

Có nhiều lý do để coi điều này là đúng, vì không chỉ những thao tác dịch chuyển trong cú pháp của tiếng Việt, mà cả của tiếng Anh cũng bị hạn chế bởi khái niệm rào chắn. Hãy coi thao tác lập câu hỏi bổ sung của tiếng Anh là (a) thay từ cần hỏi bằng một đại từ nghi vấn, ví dụ như what, và (b) nhấc nó ra khỏi vị trí cơ bản và đặt nó lên đầu câu. Nghĩa là quy tắc lập câu hỏi trong tiếng Anh cũng bao gồm cả một thao tác dịch chuyển. Nếu như khái niệm rào chắn thực sự thuộc về bản năng ngôn ngữ của con người, chúng ta phỏng đoán rằng thao tác dịch chuyển trong tiếng Anh cũng sẽ bị hạn chế như trong tiếng Việt, tức là chúng ta sẽ không thể nhấc từ what ra khỏi vị trí cơ bản của nó được nếu như nó nằm trong một chủ ngữ hay một phụ ngữ. Bằng chứng cho thấy phỏng đoán này là đúng. Từ câu (14a) chúng ta có thể có câu hỏi (14b):

(14)
  1. John thinks [Mary ate rice]
  2. What does John think [Mary ate ___ ]

Nhưng từ câu (15a) chúng ta không thể có câu (15b) được, vì [after Mary ate rice ] là phụ ngữ:

(15)
  1. John got angry [after Mary ate rice]
  2. # What did John get angry [after Mary ate ___ ]

Tương tự, từ câu (16a) ta có thể có (16b):

(16)
  1. John read [a lot of books]
  2. What did John read [a lot of ___ ]

Nhưng từ (17a) ta không thể có (17b), vì [a lot of books] là chủ ngữ:

(17)

  1. [A lot of books] will create many problems
  2. # What will [a lot of ___ ] create many problems

Chú ý rằng một câu hỏi như (15b) không có gì sai về mặt lô-gích. Nếu như không bị hạn chế bởi cấu trúc tri giác bẩm sinh, chúng ta hoàn toàn có thể dùng nó để hỏi:

(18)     for which x: John got angry after Mary ate x

Thật vậy, trong một ngôn ngữ có thể lập được câu hỏi mà không cần đến thao tác dịch chuyển, ví dụ như trong tiếng Việt, chúng ta có thể dễ dàng biểu đạt ý nghĩa (18) bằng một câu đúng ngữ pháp:

(19)     Sơn nổi giận sau khi My ăn gì?

Điều này cho thấy ngôn ngữ và tư duy là hai thứ độc lập. Để biểu đạt tư duy, chúng ta dùng ngôn ngữ, cũng như để nhìn, chúng ta dùng mắt. Ngôn ngữ là một cơ quan tri giác với những tính chất cụ thể. Có những tư duy ngôn ngữ có thể dùng những thao tác hình thức để mã hoá được, nhưng không phải tất cả, cũng như mắt chúng ta không thể nhìn thấy tia cực tím hay tia hồng ngoại vậy. Ngôn ngữ có mã hoá được một tư duy hay không thường không phụ thuộc vào nội dung hay độ phức tạp của tư duy ấy, mà phụ thuộc vào câu hỏi liệu những thao tác hình thức dùng để mã hoá tư duy ấy có nằm trong khả năng của bộ máy ngữ pháp hay không. Cả người Anh lẫn người Việt đều có khả năng "tư duy" một nội dung như (18), nhưng vì cách thức lập câu hỏi trong tiếng Anh cần đến một thao tác dịch chuyển nên người Anh không thể mã hoá cái nội dung này một cách đơn giản được. Ngược lại, người Việt có thể làm được việc đó vì đại từ nghi vấn trong tiếng Việt không cần thiết phải đứng ở đầu câu.

Chúng ta hoàn toàn có thể tưởng tượng ra một con khỉ có khả năng tư duy khá cao, biết tính toán, suy luận, thậm chí nhiều lúc cũng muốn trút bầu tâm sự. Nhưng nếu nó không được "trời phú" cho kiến thức về những khái niệm hình thức trừu tượng như âm vị, từ, câu, ngữ đoạn, ngữ pháp... hay một cái gì đó tương tự, nó sẽ không bao giờ có khả năng dùng một kiến thức hữu hạn để mã hoá, biểu đạt và chuyền tải vô số những tâm sự khác nhau. Đây không phải để cho thấy là chúng ta hơn khỉ, vì khỉ còn có rất nhiều những khả năng trời phú hay ho khác.

Nhưng như ở trên đã cho thấy, cơ quan ngôn ngữ, cũng như bất kỳ bộ phận nào khác trên cơ thể, trong khi giúp chúng ta có khả năng làm nhiều thứ, cũng có những hạn chế của nó. Cũng như bàn tay cho phép ta nắm được một vật dễ dàng nhưng không thể cho phép ta bay được như loài dơi, khái niệm rào chắn của cơ quan ngôn ngữ không cho phép ta có những thao tác dịch chuyển vượt qua những thành tố nhất định, cũng như tính cấu trúc của quy tắc ngữ pháp - xem (5) - không cho phép ta có một ngôn ngữ trong đó câu hỏi được lập thức bằng cách đảo ngược thứ tự hai từ đầu tiên của câu khẳng định, vì đây sẽ là một quy tắc không cần đến cấu trúc.

Để minh hoạ cho rõ hơn nữa tính chất cấu trúc của tất cả các quy tắc ngữ pháp, tôi xin đưa thêm ví dụ sau. Chúng ta đều biết là trong ngôn ngữ có một phạm trù gọi là tên riêng, ví dụ như My, Sơn, Tùng. Ngoài ra, chúng ta còn có những đại từ, ví dụ như tao, mày, . Có những lúc một đại từ và một tên riêng được dùng để cùng chỉ một người, ví dụ như nếu Sơn tự cho là mình rất thông minh, chúng ta có thể nói thằng Sơn cứ tưởng nó thông minh lắm. Nếu một tên riêng và một đại từ cùng chỉ một người, chúng ta nói rằng chúng đồng sở chỉ (coreferent).

Trước khi nói tiếp, tôi cần phải làm sáng tỏ một số điều. Thứ nhất, cần phải hiểu là một câu không chỉ là một chuỗi âm thanh, mà là một chuỗi âm thanh cộng với một chuỗi những phản ứng thần kinh trong đầu. Câu My ăn cơm không chỉ gồm có chuỗi âm thanh [myăncơm], mà còn hiện hữu trong óc chúng ta dưới dạng một cấu trúc phức tạp, như cho thấy ở trên. Điều này chẳng có gì mới, và Aristotle cũng chỉ phát biểu một nhận xét hiển nhiên mà thôi khi ông nói rằng ngôn ngữ là việc sản xuất âm thanh đi cùng với một hành động tưởng tượng ("speech is sound production accompanied by an act of imagination"). Cái "tưởng tượng" trong óc chúng ta khi chúng ta nghe một chuỗi âm thanh từ miệng người khác chính là cái góp phần giúp chúng ta hiểu được người kia nói gì, và ngữ pháp là cái giúp chúng ta thực hiện được cái act of imagination này một cách có nguyên tắc. Nói một cách khác, khi nghe một người nói, chúng ta suy luận rằng trong óc người đó cũng phải có những gì ta đang tưởng tượng, vì "bộ máy tưởng tượng" của cả hai người đều giống nhau.

Điều thứ hai cần phải được hiểu rõ là hệ thống chính tả chỉ thể hiện một số thông tin về cấu trúc của câu nói thôi, không phải tất cả. Nói cụ thể, hệ thống chữ cái la-tinh mà chúng ta đang dùng thể hiện một số thông tin ngữ âm, cộng thêm thông tin về ranh giới giữa các từ. Việc thứ hai này được thực hiện bằng cách để một khoảng trống giữa những chuỗi âm thanh mà ta nghĩ (tưởng tượng) là làm nên một từ. Có những hệ thống chính tả thể hiện cả thông tin về phạm trù ngữ pháp, ví dụ chính tả tiếng Đức đòi hỏi phải viết hoa tất cả các danh từ. Trong bài này, có nhữg lúc tôi đã dùng ngoặc vuông [...] để diễn tả thông tin về cấu trúc ngữ đoạn. Bây giờ tôi xin bạn đọc hãy chú ý. Trong đoạn tiếp theo tôi sẽ dùng chính tả để thể hiện thêm một thông tin nữa của những chuỗi âm thanh. Đó là thông tin về tính chất đồng sở chỉ của các danh ngữ. Cụ thể, tôi sẽ dùng chỉ số để nói rõ khi nào hai danh ngữ, một đại từ và một tên riêng, cùng chỉ một người. Hãy xem hai câu sau đây:

(20)     Thằng Sơn1 cứ tưởng nó1 thông minh lắm
(21)     Thằng Sơn1 cứ tưởng nó2 thông minh lắm

Cần phải hiểu (20) và (21) là hai chuỗi âm thanh đi cùng với hai tưởng tượng khác nhau, tức là hai cấu trúc ngôn ngữ khác nhau, tóm lại, hai câu khác nhau. Trong câu (20), x nghĩ là x thông minh, với x = Sơn. Trong câu (21), x nghĩ là y thông minh, với x = Sơn và x ( y, tức là Sơn nghĩ Hưng, hoặc Tuấn, hoặc John ... thông minh.

Có thể thấy là (20) và (21) đều là những cấu trúc hợp lệ trong ngôn ngữ. Nghĩa là, đại từ và tên riêng có thể đồng sở chỉ, có thể không. Nhưng ta sẽ thấy sự thật không đơn giản như vậy, vì có những lúc đại từ và tên riêng không thể đồng sở chỉ được. Ví dụ, (22) là một câu không thể chấp nhận được:

(22)     # Nó1 cứ tưởng thằng Sơn1 thông minh lắm

Có thể chắc chắn là chưa bao giờ có ai nghĩ đến nói một câu như (22) cả, tức là chưa bao giờ nghĩ đến chuyện phát ngôn cái chuỗi âm thanh đó mà trong đầu nghĩ thằng Sơn là đồng sở chỉ. Câu (22) là một câu nằm ngoài common sense của chúng ta, nghĩa là chỉ cần biết khái niệm tên riêngđại từ là chúng ta sẽ tự động biết rằng không thể có một câu như (22) được, trong bất kỳ thứ tiếng nào, không cần ai dạy cả. Vậy thì quy tắc nào cho chúng ta biết điều đó. Hãy giả thiết một quy tắc như sau:

(23)     Đại từ và tên riêng không được phép đồng sở chỉ nếu đại từ đứng trước tên riêng

Nếu chú ý sẽ thấy quy tắc (23) là một quy tắc vô cấu trúc. Nó không cần biết gì đến cấu trúc ngữ đoạn của câu mà chỉ dùng đến thứ tự tuyến tính của các từ. Xét về bản chất, quy tắc này cũng không khác gì cái quy tắc lập câu hỏi bằng cách đảo ngược thứ tự từ là mấy. Vậy nên chúng ta có thể phỏng đoán là nó không phù hợp với cách làm việc của cơ quan ngôn ngữ bẩm sinh. Phỏng đoán này đúng, vì bằng chứng cho thấy là có thể có những câu trong đó đại từ đi trước tên riêng nhưng cả hai vẫn có thể đồng sở chỉ:

(24)     Mẹ nó1 phải nói mãi thằng Sơn1 mới chịu nghe

Vậy thì quy tắc dùng đại từ và tên riêng đồng sở chỉ là gì. Hãy xem cấu trúc ngữ đoạn của các câu nói trên - tôi xin đơn giản hoá một chút cho dễ nhìn, điều này sẽ không ảnh hưởng gì đến nội dung đang bàn:

(25)    
  1. [Thằng Sơn1 [cứ tưởng nó1 thông minh lắm]]
  2. # [Nó1 [cứ tưởng thằng Sơn1 thông minh lắm]]
  3. [[Mẹ nó1 phải nói mãi] [thằng Sơn1 mới chịu nghe]]

Hãy định nghĩa khái niệm phạm vi (domain). Phạm vi của một phần tử là thành tố nhỏ nhất chứa phần tử ấy. Có thể thấy rằng quy tắc chỉ định sự phân bố của tên riêng và đại từ là:

(26)     Đại từ và tên riêng không thể đồng sở chỉ nếu tên riêng nằm trong phạm vi của đại từ

Trong câu (25b), phạm vi - tức là thành tố nhỏ nhất chứa - đại từ là cả câu, và tên riêng thằng Sơn nằm trong đó, vì vậy nên câu này sai với cách hiểu thằng Sơn là đồng sở chỉ. Trong các câu khác thì không phải như vậy, tức là đại từ luôn luôn nằm trong một thành tố không chứa thằng Sơn.

Một lần nữa xin nhắc lại là câu (25b) sai không phải vì nó là một chuỗi âm thanh không thể có được, mà là vì sự đồng sở chỉ của những danh ngữ nằm trong nó vi phạm quy tắc (26). Ta hoàn toàn có thể có một chuỗi âm thanh như (25b) nhưng là một câu đúng ngữ pháp, không vi phạm quy tắc gì cả, đó là:

(27)     Nó1 cứ tưởng thằng Sơn2 thông minh lắm

Có thể dễ dàng chứng minh là quy tắc (26) đúng cho ít nhất là cả tiếng Anh, tiếng Đức, tiếng Pháp, tiếng Tàu ... và tôi tin rằng nó đúng cho tất cả các thứ tiếng, nhưng có lẽ là không cần thiết phải làm như vậy ở đây. Chúng ta còn có thể thấy rằng (26) là một quy tắc mang tính cấu trúc, tức là nó cần phải dựa vào khái niệm phạm vi là một khái niệm được định nghĩa trên cơ sở cấu trúc thành tố (constituent structure). Câu hỏi được đặt ra là tại sao chúng ta lại không hài lòng với một quy tắc tuyến tính đơn giản như (23), hay thậm chí chẳng quy tắc nào cả, tại sao lại phải làm một thao tác tính toán phức tạp cần đến một khái niệm cấu trúc trừu tượng như phạm vi. Một lần nữa, câu trả lời là "trời sinh ra thế". Thực ra, chúng ta không hề cảm thấy có một cái gì khó hay phức tạp trong việc học và sử dụng ngôn ngữ, vì đó là một khả năng bẩm sinh, cũng như con dơi không hề cảm thấy có gì khó khăn trong việc phát ra 200 tiếng kêu trong một giây, nghe tiếng vọng và tính được con mồi đang chạy đi đâu. Chúng ta, và con dơi, đều cảm thấy đấy là những việc tất nhiên, chẳng có gì lạ và phức tạp cả. Nhưng có những việc rất đơn giản mà chúng ta lại gặp khó khăn thực hiện, ví dụ như nạp vào trí nhớ quá 7 thứ một lúc hay uống nước bọt của chính mình nhổ ra mà không cảm thấy kinh. Đó là vì chúng ta không được lập chương trình để làm những việc như vậy.

Tôi hy vọng đã sáng tỏ được phần nào vai trò của cơ quan ngôn ngữ bẩm sinh trong việc phân tích các dữ liệu ngôn ngữ, hay nói đúng hơn là trong việc biến một tập hợp con của những tiếng động lọt vào tai thành dữ liệu ngôn ngữ, để rồi từ đó đi đến một ngữ pháp. Có thể nói ngữ pháp tiếng Việt của một người là kết quả của tác động từ phía những âm thanh lọt vào tai người đó vào cơ quan ngôn ngữ bẩm sinh của anh ta. Đối với Chomsky và những người đi theo ông, cơ quan này của con người là mục đích chính của nghiên cứu. Những kiến thức thu thập được trong việc mô tả những ngôn ngữ cụ thể như tiếng Anh và tiếng Việt được coi là thú vị và quan yếu trong chừng mực là chúng đóng góp vào việc gây dựng hay cải cách lý thuyết về cơ quan ngôn ngữ bẩm sinh, qua đó đóng góp vào sự hiểu biết của chúng ta về cơ cấu và hoạt động của đầu óc con người, vật thể phức tạp nhất trong vũ trụ từng được biết.

Để nói về hai phần sau của sơ đồ (1) - ngôn ngữ và những diễn đạt có cấu trúc - tôi sẽ bắt đầu bằng việc làm sáng tỏ một số vấn đề thuật ngữ. Phần dữ liệu còn có tên là PLD (primary linguistic data), cơ quan ngôn ngữ ngày xưa được gọi là LAD (language acquisition device), nay hay được thay bằng FL (faculty of language). Lý thuyết mô tả FL được gọi là UG (universal grammar). Ngôn ngữ, tức là những kiến thức giúp chúng ta nói và hiểu - hay xác định được là đúng - một tập hợp vô số những diễn đạt, có cái tên chuyên môn chính xác là I-language, nhưng thường được gọi là language khi văn cảnh đã cho thấy rõ cái gì đang được nói đến. Lý thuyết mô tả một I-language được gọi là (generative) grammar. Những diễn đạt có cấu trúc còn được gọi là SD (structural description). Một điều cần lưu ý là những khái niệm UGgrammar rất hay được dùng với một sự đa nghĩa có hệ thống (systematic ambiguity), tức là chúng vừa chỉ những thực thể trên thế giới - FL và I-language - vừa chỉ cái lý thuyết về những thực thể ấy.

Tôi sẽ trích một số đoạn Chomsky nói về những khái niệm này, vì không ai có thể nói rõ ràng và chính xác như ông.

Về UG và cơ quan ngôn ngữ:

"UG may be regarded as a characterization of the genetically determined language faculty. One may think of this faculty as a "language acquisition device", an innate component of the human mind that yields a particular language through interaction with presented experience, a device that converts experience into a system of knowledge attained: knowledge of one or another language." [Chomsky 1986]

Về ngôn ngữ:

"When we say that Jones has the language L, we now mean that Jones's language faculty is in the state L, which we identify with a generative procedure...let us refer to it as I-language, where I is to suggest "internal", "individual", "intensional." The concept of language is internal, in that it deals with an inner state of Jones's mind/brain. It is individual in that it deals with Jones, and with language communities only derivatively, as groups of people with similar I-languages. It is intensional in the technical sense that the I-language is a function specified in intension, not extension: its extension is the set of SDs [i.e. structural descriptions]... When we use the term language below, we mean I-language...

We assume that the language (the generative procedure, the I-language) has two components: a computational system and a lexicon. The first generates the form of SDs; the second characterizes the lexical items that appear in them." [Chomsky 1995]

Đoạn văn trên có thể hiểu nôm na như sau. Khi X biết một thứ tiếng, giả sử tiếng Việt, có nghĩa là cái sơ quan ngôn ngữ trong não của X ở trong một trạng thái nhất định. Cái trạng thái này có thể được coi trạng thái "biết" - một lần nữa, "biết" theo nghĩa bản năng và tiềm ẩn, biết mà không cần phải biết là biết - một số kiến thức, ví dụ:

(26)
  1. Câu = Danh ngữ + Vị ngữ
    Danh ngữ = ...Danh từ ...
    Vị ngữ = ... Vị từ ...
    v.v....
  2. Đề hoá = Đặt X lên đầu câu trước từ thì
    v.v...
  3. Rào chắn = Những gì không phải bổ ngữ
    v.v...
  4. Không được dùng âm [p] để mở đầu một từ
    v.v...
  5. Từ (lexical items) trong tiếng Việt:

    1. Ngữ âm = [mặt zời]
      Phạm trù ngữ pháp = danh từ
      Ngữ nghĩa = SUN
    2. Ngữ âm = [my]
      Phạm trù ngữ pháp = Danh từ/Tên riêng
      Ngữ nghĩa = MY
    3. Ngữ âm = [ăn]
      Phạm trù ngữ pháp = Vị từ
      Ngữ nghĩa = EAT
    4. Ngữ âm = [cơm]
      Phạm trù ngữ pháp = Danh từ
      Ngữ nghĩa = COOKED RICE
      v.v...

Trạng thái này có tính chất generative, tức là chúng xác định (sản sinh/mô tả/generate/specify) một số những vật thể, và trong trường hợp này thì những vật thể đó là những cấu trúc ngôn ngữ. Ví dụ, những kiến thức trong (26) xác định (generate) những cấu trúc sau:

(27)
  1. [Câu [Danh ngữ [Danh từ My]][Vị ngữ [Vị từ ăn][Danh ngữ [Danh từ cơm]]]]
  2. Cơm thì [Câu My ăn ___ ]
  3. búp bê
  4. [Danh từ mặt giời]

Nhưng những kiến thức trong (26) không xác định (sản sinh/mô tả/generate...) những cấu trúc sau:

(28)
  1. [Câu [Vị ngữ Ăn cơm] [Danh ngữ My]]
  2. Cơm thì [Sơn nổi giận [Phụ ngữ sau khi My ăn ___ ]]
  3. púp pê
  4. [Danh từ mặt trời]

Khái niệm intension (nội hàm) và extension (ngoại diên) có thể giải thích như sau. Nội hàm là một tính chất, ngoại diên là tất cả những vật thể có tính chất đó. Ví dụ ý niệm ngựa là một nội hàm, nó là tập hợp của những tính chất xác định một loài vật. Ngoại diên của nó tất cả những vật thể mà ta có thể chỉ tay vào và nói rằng "đây là một con ngựa". Tương tự, có thể coi những kiến thức trong (26) là một nội hàm. Ngoại diên của (26) sẽ là tất cả những cấu trúc mà chúng xác định. Giả thiết của Chomsky là ngôn ngữ tồn tại dưới dạng một nội hàm, tức dưới dạng một tập hợp những kiến thức xác định những cấu trúc, chứ không phải dưới dạng một tập hợp của chính bản thân những cấu trúc ấy. Điều này tôi nghĩ là tất nhiên phải đúng, vì tập hợp những kiến thức là hữu hạn, còn tập hợp những cấu trúc là vô hạn, và óc chúng ta, tuy khá là to, vẫn không thể vô hạn được. Theo tôi, đây là một cách diễn đạt khác cái quan niệm (dễ hiểu) của Humboldt cho rằng ngôn ngữ là sự "sử dụng vô hạn những phương tiện hữu hạn" (infinite use of finite means / unendlicher Gebrauch von endlichen Mitteln). Tuy nhiên tôi cũng không dám chắc về điều này. Xin lưu ý là trong ngôn ngữ, cả nội hàm - những kiến thức - và ngoại diên - những cấu trúc - đều là những thực thể tâm lý, hiện hữu nội tại trong cá nhân.

Thế còn ngữ pháp là gì? Câu trả lời rất đơn giản: ngữ pháp hoặc chính là ngôn ngữ, hoặc là lý thuyết mô tả ngôn ngữ. Có thể nói X có một ngôn ngữ trong đầu, và cũng có thể nói X có một ngữ pháp trong đầu. "Using the term grammar with a systematic ambiguity ... to refer, first, to the native speaker's internally represented "theory of his language" and, second, to the linguist's account of this..." [Chomsky 1965]. Mặc dù sau này Chomsky tránh sự đa nghĩa này và dùng khái niệm ngữ pháp chỉ để nói lý thuyết về I-language. Xin lưu ý một lần nữa là điều này hoàn toàn không có nghĩa ngữ pháp, hay ngôn ngữ, tồn tại ngoài cá nhân. Đầu của X thế nào thì ngôn ngữ của X thế ấy, và ngôn ngữ của X thế nào thì ngữ pháp của X thế ấy.

Tôi xin kết thúc bài viết này bằng việc trả lời những ý kiến của Quốc Việt (QV). Trong số những cái tôi hiểu trong bài QV - không phải lúc nào tôi cũng hiểu anh muốn nói gì - tôi thấy cái khác nhau đáng nói nhất giữa QV và tôi chỉ nằm ở chỗ QV nghĩ là phần ngôn ngữ (language) trong cái sơ đồ anh đưa ra của Chomsky (xem (1)) có tồn tại ngoài cá nhân, vì anh nói: "Trong khía cạnh xã hội của ngôn ngữ, người ta rất có thể chỉ quan tâm tới phần dữ liệu hay là phần bên dưới của việc diễn đạt có cấu trúc. Và đây là nơi ta có thể nói rằng có một thứ tiếng Việt tồn tại ngoài ý muốn một cá nhân." Tôi thực sự nghĩ là QV đã hiểu sai Chomsky. Ý kiến của tôi thế nào thì những gì ở trên đã cho thấy rõ.

Còn những chỗ khác biệt khác giữa QV và tôi thì chỉ mang tính chất thuật ngữ mà thôi. Theo như tôi hiểu QV thì anh coi ngữ pháp đồng nghĩa với cú pháp (syntax), vậy nên nếu X nói "mặt giời" còn Y nói "mặt trời" thì đó cũng không phải là do X và Y có hai ngữ pháp khác nhau. Tôi thì hiểu ngữ pháp đơn giản là lý thuyết về kiến thức ngôn ngữ nói chung, bao gồm ít nhất kiến thức về cú pháp, ngữ âm, ngữ nghĩa, từ vựng ...và cũng phải nói rằng trong tất cả các mô hình ngữ pháp mà tôi đã từng học, cái nào cũng cho phép ta diễn tả sự khác nhau giữa một ngôn ngữ có từ "mặt giời" và một ngôn ngữ có từ "mặt trời". Nhưng một lần nữa, đây chỉ là vấn đề định nghĩa. QV hoàn toàn có thể định nghĩa ngữ pháp theo cách của anh.

Tôi hy vọng là bằng những dòng trên, tôi đã phần nào thuyết phục được độc giả là quy tắc ngữ pháp khác luật giao thông đến mức nào. Quy tắc ngữ pháp được học và sử dụng một cách bản năng và tự nhiên. Chúng ta theo mà không biết là mình theo. Quy tắc ngữ pháp hình thành một cách tự nhiên trong óc chúng ta để rồi sau đó chúng ta có thể dựa vào chúng mà xác định được những câu đúng. Luật giao thông được học và áp dụng một cách hiển ngôn. Ai cũng có thể nói rõ chúng là cái gì. Chúng được hình thành sau khi chúng ta quyết định là đi thế này là đúng còn đi thế kia là sai. Có thể nói trong trường hợp ngôn ngữ, nội hàm (quy tắc) quyết định ngoại diên (cấu trúc đúng hình thức), còn trong trường hợp luật giao thông, ngoại diên (những lối đi lại đúng hình thức) quyết định nội hàm (quy luật về giao thông). Khi chúng ta vi phạm luật giao thông, ví dụ đi bên trái ở Việt nam, chúng ta chỉ cảm thấy lo bị tai nạn hay bị phạt, nhưng bản thân việc đi bên trái thì chẳng có gì quái gở hơn việc đi bên phải cả, và ai cũng biết là nếu ở Anh thì mọi thứ sẽ khác. Nhưng khi chúng ta nghe một câu như sách thì nhiều sinh ra lắm vấn đề, hay nó cứ tưởng Sơn thông minh với Sơn cùng chỉ một người, chúng ta có thể "cảm thấy" được là những câu đó thật quái gở, thật trái tự nhiên. Hơn nữa, chúng ta không biết tại sao lại như vậy. Đó là vì việc đi bên trái vi phạm một quy ước xã hội tồn tại ngoài cá nhân, còn những câu kia vi phạm những quy luật hoạt động nội tại của một cơ quan tri giác làm nên một phần trong cấu tạo sinh học của từng cá nhân.



Tài liệu tham khảo
Chomsky, N. (1957)
Syntactic Structures. Mouton, The Hague.
____ (1965)
Aspects of the Theory of Syntax. MIT, Cambridge.
____ (1975)
The Logical Structures of Linguistic Theory. Plenum, New York.
____ (1986)
Knowledge of Language. Its Nature, Origin, and Use. Praeger, London.
____ (1995)
The Minimalist Program. MIT, Cambridge.
____ (2002)
On Nature and Language. Cambridge University Press, Cambridge.
Dawkins, R. (1986)
The Blind Watchmaker. Penguine Books, London.
Pinker, S. (1994)
The Language Instinct. William Morrow and Company, New York.
____ (1997)
How the Mind Works. Penguine Books, London.


© 2003 talawas