Las leyes de la lingüística en los sistemas de comunicación

Author

Hernández-Fernández, Antoni

Director

Ferrer i Cancho, Ramon

Diéguez-Vide, Faustino

Tutor

Martí Antonin, M. Antònia

Date of defense

2014-05-08

Legal Deposit

B 16145-2014

Pages

274 p.



Department/Institute

Universitat de Barcelona. Departament de Lingüística General

Abstract

Esta tesis se presenta como compendio de publicaciones. Se hace una breve revisión de la lingüística cuantitativa y algunas de sus leyes: la ley de Zipf, la ley de Menzerath-Altmann y la ley de brevedad. Se propone además el principio de compresión en ciencia cognitiva y lenguaje. Para empezar, se presenta la ley de Zipf y se revisa la relación entre el exponente de la distribución de frecuencias y el exponente de la relación potencial entre la frecuencia y su rango. Se demuestra que ambos exponentes coinciden únicamente cuando su valor es el número de oro. Tras revisar las desviaciones de la ley de Zipf en el lenguaje, se incluye el primer estudio de estas desviaciones realizado con corpus de enfermos de Alzheimer, con el ánimo de detectar la evolución verbal de la enfermedad, lo que en el futuro podría ayudar a mejorar la detección precoz de la patología. Al explicar la ley de Menzerath-Altmann se muestra su no trivialidad estadística, y se aplica al estudio del nivel cromosómico del genoma y su relación con los modelos de fragmentación aleatoria. Posteriormente, tras exponer la ley de brevedad, se corroboró su presencia en los corpus de siete lenguas y se exploró, con diversos resultados, en el repertorio de delfines y en las emisiones de primates no humanos y cuervos. Seguidamente se presentan algunos principios generales que rigen la comunicación, entre ellos el principio de compresión, que tiene como consecuencia la ley de brevedad. El principio de compresión, originario de la teoría de la información, se propone para la ciencia cognitiva y la comunicación. Por último, se explora el fenómeno de la comunicación química, más allá del ADN. Tras revisar los conceptos de infoquímico, feromona y aleloquímico, se analiza cuantitativamente la base de datos Pherobase, encontrando dos regímenes de la ley de Zipf en la distribución de infoquímicos según el grado o número de especies que utiliza cada sustancia, lo que demostraría que también hay un repertorio químico nuclear y otro periférico en la comunicación química, en analogía a lo que sucede en el lenguaje.


vThis thesis is presented as a compendium of articles. It is a brief review of quantitative Linguistics and some of its laws: Zipf's law, Menzerath-Altmann’s law and brevity’s law. Also we propose and intend to integrate the principle of compression in cognitive science and language. First, we revisit Zipf’s law and the relationship between power law distribution of a magnitude and the corresponding power relationship between the magnitude of a certain element and its rank. We show that the exponents of the two power laws coincide when its value is the famous golden number. Deviations from the Zipf’s exponent in the words of mid-frequency for GDS5 patients with Alzheimer’s Disease (AD) have been observed, but not for GDS4 patients, showing that it is possible to predict the evolution from one disease stage to another in the AD and determine when syntax is altered, exploring the simple oral production of the patient. After that, we demonstrate that words follow Zipf’s law of brevity in human language, and conformity to this general pattern has been seen in the behavior of a number of other species. It has been argued that the presence of this law is a sign of efficient coding in the information theoretic sense, and the law has been connected with compression’s principle, the information theoretic principle of minimizing the expected length of a code. We argue that compression is a general principle of animal behavior that reflects selection for efficiency of coding. Finally, we explore Menzerath-Altmann’s law in genomes, aplying quantitative linguistics powerful tools for investigating nontrivial connections between human language and genomes. The distribution of infochemicals across species is investigated when they are ranked by their degree and we find that a double Zipf (a Zipf distribution with two regimes with a different exponent each) is the model yielding the best fit. This suggests that the world wide repertoire of infochemicals contains a chemical nucleus shared by many species and reminiscent of the core vocabularies found for human language in dictionaries or large corpora.

Keywords

Psicolingüística; Psycholinguistics; Comunicació animal; Comunicación animal; Animal communication; Cromosomes; Cromosomas; Chromosomes; Malaltia d'Alzheimer; Enfermedad de Alzheimer; Alzheimer's disease; Llei de Zipf; Ley de Zipf; Zipf's law; Menzerath–Altmann law; Llei de Menzerath–Altmann; Ley de Menzerath–Altmann

Subjects

81 - Linguistics and languages

Knowledge Area

Ciències Humanes i Socials

Documents

AHF_TESIS.pdf

7.195Mb

 

Rights

ADVERTIMENT. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.

This item appears in the following Collection(s)