LE LINGUE TIBETANE RIUNITE DALL’AI

  • by Redazione I
  • |
  • 09 Dic 2025
  • |
LE LINGUE TIBETANE RIUNITE DALL’AI, Mirabile Tibet


Un modello linguistico di grandi dimensioni, chiamato ‘SunshineGLM V1.0’, è stato di recente reso pubblico a Lhasa. Parliamo della tecnologia AI incentrata sulla comprensione e l’analisi di un testo (Large Language Model, LLM) e che – vista la ricchezza e la complessità del Tibetano – ha usato circa 28,8 miliardi di token di dati di alta qualità.

Dati che hanno incluso un corpus su larga scala di frasi e testi tibetani, raccolte di traduzioni Tibetano-Cinesi e Tibetano-Inglesi, e voci provenienti dal parlato e lo scritto sull’Altopiano, che combinano – in maniera diffusa e da secoli – Tibetano, Mandarino e (antichi e moderni) dialetti misti. Spaziando dalle parole della Filosofia o della Medicina a quelle del Diritto, della Cultura in generale, delle tecnologie, della trasmissione orale, della Scienza e persino del Giornalismo.

‘SunshineGLM V1.0’ può dunque gestire strutture linguistiche complesse e conoscenze “multi-dominio”, con una accurata comprensione semantica, e anche di dare risposte rapide alle domande, generare testi attendibili e tradurre con un’alta fedeltà al senso. Grazie a queste capacità, il modello potrà dunque essere applicato in tutti gli ambiti nei quali il bisogno di comprendersi diventa vitale – dal lavorare o studiare assieme all’assistenza medica e al turismo. Cioè, in tutti i momenti di incontro tra le diverse etnie che da secoli vivono sull’Altopiano, senza dimenticare quelli tra i residenti, la Cultura dell’Altopiano e i visitatori o studiosi di tutto il mondo.

Per certi versi, l’opposto della Torre di Babele. In grado di riunire quello che, per molto tempo, distanze e ostacoli geografici – ma anche sociali ed economici – avevano rischiato di separare. Perché, più che una lingua, il Tibetano è una famiglia. Di circa 50 lingue e oltre 200 dialetti derivati dall’antico, parlati (principalmente, perché linguaggio del Buddhismo) da circa 6 milioni di persone tra il Nepal, il Bhutan, alcune parti dell’India del nord, del Pakistan e della Cina e persino il Myanmar. Una famiglia con tre riferimenti principali: per il parlato, il dialetto di Lhasa; per lo scritto, anche moderno, la forma sviluppata nel IX secolo in base alla scrittura indiana; per la religione, il cosiddetto ‘Tibetano classico’, liturgico e standardizzato tra il VII e il IX secolo presso i monasteri. Pertanto, tra i diversi accessi nel tempo all’istruzione, il nomadismo pastorale, il lungo isolamento di alcune comunità, le distanze geografiche e le differenze tra linguaggi parlati e scritti, 6 milioni di persone che non sempre riuscivano a capirsi.

Oltre al Buddhismo tibetano, un altro ponte tra culture.