![]() |
IT4LT Modulo 3.5 Trattamento Automatico della Lingua (TAL) Human Language Technologies (HLT) |
Indice
1. Trattamento Automatico del Linguaggio (TAL): una definizione
4. Introduzione alla tecnologia del parlato
5. Parsing sintattico e etichettatura)
Obiettivo di questo modulo è esplorare alcuni degli aspetti e delle sfide del Tratamento Automatico della Lingua (TAL), rilevanti ai fini dellapprendimento linguistico assistito da computer (CALL). Inizieremo con un breve resoconto di alcuni dei primi tentativi HLT, analizzando le macchine per la traduzione automatica (TA). Risulterà quindi chiaro che le esperienze ed i risultati in questo campo hanno conseguenze dirette su alcuni sviluppi di CALL. CALL è stato sin dallinizio un campo di ricerca, di sviluppo e di applicazione multidisciplinare. Alcuni ricercatori cominciarono a sviluppare applicazioni di CALL, che utilizzavano le Tecnologie per le lingue umane, e alcune di queste verranno presentate in questo modulo. Verranno anche discussi i vantaggi e i limiti dellapplicazione di TAL a CALL, analizzando ad esempio CALL basato sugli analizzatori sintattici. Questa breve discussione potrà fornire la base per lo sviluppo di prime ipotesi circa la natura dellinterazione uomo-computer (HCI) in CALL basato sugli analizzatori sintattici.
Gli autori di questo modulo
Piklu Gupta è docente di Linguistica Germanica allUniversità di Hull, UK. Insegna Lingua Tedesca e Linguistica Germanica a livello universitario e ICT e i processi del linguaggio naturale a livello post-universitario. Ha esperienza di insegnamento nella Scuola Secondaria e agli adulti. Si interessa, nelle sue ricerche, di lessicografia computazionale e linguistica dei corpora: http://www.hull.ac.uk/german/gupta
Mathias Schulze è docente di Tedesco presso la UMIST, una delle quattro università di Manchester, UK. Insegna tedesco e Linguistica a livello universitario e CALL a livello post-universitario. I suoi campi di ricerca sono CALL basato sugli analizzatori e linguistica.http://www.ccl.umist.ac.uk/staff/mathias
Graham Davies, Curatore, Thames Valley University, UK http://www.camsoftpartners.co.uk/cvgd.htm
1. Trattamento Automatico della Lingua
Indice della Sezione 1
1.1 TAL: una definizione
Trattamento automatico della lingua (TAL) è un nuovo termine con il quale si ingloba unampia gamma di ricerche e di sviluppi propri di quella sfera che era un tempo definita tecnologie linguistiche o Ingegneria linguistica o linguistica computazionale. Obiettivo di questo modulo è la familiarizzazione con alcune aree chiave di TAL, in particolare:
I processi del linguaggio naturale
La Traduzione automatica
Le tecnologie del discorso
Ovviamente questo modulo non ha lambizione di insegnare tutto ciò che si può sapere riguardo a TAL. Ciò è impraticabile possibile, e comunque non necessario. (I due autori del modulo ne sono testimonianza vivente hanno iniziato ambedue come insegnanti di lingua e solo successivamente si sono interessati a TAL.) Abbiamo usato la Traduzione Automatizzata), gli analizzatori sintattici del linguaggio naturale e le loro applicazioni a CALL come esempi (importanti). Le altre tecnologie, che rientrano sotto la più vasta etichetta TAL, verranno solo presentate brevemente.
Il titolo di questo modulo riflette i cambiamenti avvenuti nel settore dellIngegneria Linguistica dei Programmi di Applicazioni Telematiche della Commissione Europea (DG XIII). Vedi la pagina HLT (lanciata nel gennaio del 1999) sul sito Linglink:
Questo sito web è stato lanciato come HLTCentral, un trampolino per accedere alle risorse relative alle tecnologie della lingua sul web. Alcune tecnologie della lingua avanzate sono spiegate nel sito ed è stata attivata una lista di discussione con la presenza di un moderatore. Cè un ampio elenco di link a risorse TAL sul Web.
Una utile pubblicazione introduttiva, intitolata Language and Technology: from the Tower of Babel to the Global Village, può essere scaricata in formato Acrobat dal seguente indirizzo presso il sito della Multilingual Information Society (MLIS) della Comunità Europea cliccare sulla L&T Brochure alla pagina seguente:
http://158.169.50.95:10080/mlis/en/document/home.html
Un CD-ROM multilingue intitolato A world of understanding è stato prodotto per conto della DG XIII della Commissione Europea.
http://europa.eu.int/comm/dgs/information_society/index_en.htm
Lo scopo del CD-ROM è dimostrare limportanza di TAL nel percepire i benefici della Società multilingue dell'informazione, in particolare nel predisporre una documentazione e una registrazione per il settore dell'ingegneria linguistica per il Quarto Programma Quadro dellUnione Europea (1994-98). Contattare Linglink (vedi sopra) per ulteriori dettagli.
1.2 Introduzione a TAL
" non ci sono dubbi riguardo al fatto che lo sviluppo degli strumenti (tecnologia) dipenda dal linguaggio è difficile immaginare come un qualsiasi strumento da un cesello ad uno scanner CAT possa essere costruito senza comunicazione, senza linguaggio. Ciò che risulta meno ovvio è il fatto che lo sviluppo e levoluzione del linguaggio - la sua efficacia in una comunicazione più veloce, con più persone, con maggiore chiarezza dipenda sempre più da strumenti sofisticati." (Language and technology 1996:1)
Language and technology presenta il seguente elenco di Tecnologie della lingua (il termine viene usato con un accezione molto ampia):
Macchina da scrivere (p.2)
Penna a sfera (p.3)
Correttore ortografico, video scrittura (p.4)
Correttore grammaticale/stilistico (p.6)
Thesaurus (p.7)
Database terminologici (p.8)
Stampa (p.9)
Fotocopiatrice (p.10)
Stampante laser (p.11)
Fax (p.12)
Desktop Publishing (p.13)
Scanner, modem (p.15)
Posta elettronica (p.16)
Machine translation (traduzione automatizzata) (p.17)
Translators workbench (Scrivania del Traduttore) (p.18)
Registratore, motori di ricerca di database (p.19)
Telefono (p.25)
Molti di questi strumenti tecnologici sono già impiegati nellinsegnamento e nellapprendimento delle lingue. Attualmente la parte più considerevole della ricerca dello sviluppo dellefficacia delle comunicazioni umane (ad es. e-mail e conferenze web) e dellinterazione con le macchine (ad es. traduzione automatica) e possibilità per i motori di ricerca di interfacciarsi con il linguaggio naturale) è campo di applicazione del Trattamento Automatico della Lingua:
"Il campo del Trattamento Automatico della lingua include unampia gamma di attività il cui scopo è consentire alla gente di comunicare con le macchine attraverso le abilità comunicative naturali. Attività di ricerca e sviluppo sono la codificazione, il riconoscimento, linterpretazione, la traduzione e la generazione del linguaggio. I progressi nel Trattamento Automatico della Lingua promettono possibilità di accesso quasi universale alle informazioni e ai servizi on-line. Dal momento che la quasi totalità degli individui parla e comprende una lingua, lo sviluppo dei sistemi di lingua parlata consentiranno linterazione con il computer anche in assenza di abilità particolari o di addestramento, mediante lutilizzo di strumenti comuni, quali ad esempio il telefono. Questi sistemi saranno in grado di comprendere e generare la lingua parlata e di consentire, attraverso questa, linterazione con i computer al fine di ottenere informazioni su qualsiasi argomento, di concludere operazioni di lavoro e di migliorare la comunicazione tra gli individui." (Cole 1996)
La possibilità di usare macchine che facilitassero e sostenessero tutti gli aspetti della comunicazione umana ha interessato i ricercatori per alcuni secoli. Luso di utensili meccanici per il superamento di barriere linguistici fu ipotizzato per la prima volta nel diciassettesimo secolo. Successivamente Leibniz, Descartes e altri (cfr. Hutchins 1986:21) proposero lutilizzo di codici numerici per processi di mediazione tra le lingue. Gli albori di ciò che noi oggi chiamiamo Trattamento Automatico della Lingua sono ovviamente collegati allavvento dei computer. In un articolo scritto nel 1948, Turing, uno dei padri dellIntelligenza Artificiale, che condusse attività di analisi crittografata durante la seconda guerra mondiale, con luso della macchina Colossus, a Bletchley Park, elenca alcune varie attività in cui questi nuovi computer poteva dimostrare la loro "intelligenza":
"(i) giochi vari, ad es. scacchi, tris, bridge, poker; (ii) apprendimento linguistico; (iii) traduzione di lingue; (iv) crittografia; (v) matematica. (Turing 1948)", citato in Hutchins 1986:26f; il corsivo è stato aggiunto)
Il termine Traduzione automatica fu coniato nel 1947 da Booth e Weaver, in un periodo immediatamente successivo alla prima produzione di computer e di programmi per computer. La traduzione automatica godette di un periodo di notorietà, con ricercatori ed enti finanziatori negli Stati Uniti e nella Repubblica Sovietica.
"A partire dal 1956 in poi, i dollari (e i rubli) iniziarono veramente a scorrere. Tra il 1956 e il 1959, vennero a crearsi presso diverse università statunitensi, associazioni private e centri di ricerca, almeno dodici gruppi di ricerca. Lottimismo e lentusiasmo con cui i ricercatori affrontarono la TA (Traduzione Automatica) può forse essere esemplificato da alcune vedute profetiche di Reifler, il cui atteggiamento può essere considerato emblematico e rappresentativo della maggior parte degli studiosi coinvolti in TA a quel tempo: " non manca molto tempo alla risoluzione degli ultimi problemi linguistici per alcune lingue importanti in traduzione automatica" (Reifler 1958:518), e, "entro circa due anni (dallagosto del 1957), possederemo uno strumento che renderà possibile la lettura immediata e il conseguente trasferimento delle informazioni contenute in unintera pagina su registratore, rendendo quindi superflua la cooperazione umana nella fase di input sulle macchine traduttrici" (Reifler 1958:516)." citato in Buchmann 1987:14)
I linguisti, gli insegnanti di lingue e chiunque utilizzi oggi un computer potrebbero ritenere ridicole queste previsioni; tuttavia furono proprio lentusiasmo e il lavoro di quegli anni a creare le basi di molti dei progressi di oggi.
2. Applicazioni comuni di TAL
Le ricerche ed i progressi in HLT sono attualmente trasferiti al sistema commerciale molto più rapidamente di quanto accadesse fino agli anni 80, infatti TAL è sempre più presente nelle nostre vite di ogni giorno.Oltre alle note aree di Traduzione automatica (Sezione 3) e Riconoscimento vocale (Sezione 4) - che sono ambedue commercializzate in applicazioni economiche di qualità variabile sia per il mercato commerciale che per quello privato stanno emergendo aree inizialmente imprevedibili. Ad esempio, è ora comune che i telefoni cellulari abbiano ciò che è generalmente conosciuto come predictive text input, ossia un supporto alla scrittura di brevi messaggi: http://www.tegic.com. Anziché premere, per un determinato numero di volte, uno dei nove tasti numerici della pulsantiera, al fine di riprodurre la lettera corretta di una data parola, il software del telefono confronta gli impulsi meccanici dellutente sulla tastiera con un database linguistico. Ciò consente di determinare la parola più corretta (o quella più probabile). Anche la maggior parte dei motori di ricerca Internet attualmente incorpora un genere di tecnologia linguistica che permette allutenza di porre domande nel linguaggio naturale, per esempio "Cosa si intende per rapporto di verosimiglianza logaritmica? È accettabile quanto la richiesta di ricerca "rapporto di verosimiglianza logaritmica".
Quali sono i possibili benefici dellutilizzo di TAL nellinsegnamento-apprendimento delle lingue? Ecco alcuni esempi: luso di etichette di parti del discorso (vedi Sezione 5) potrebbe consentire, a quegli insegnanti che desiderino "pre-trattare" un testo per metterne in evidenza alcuni aspetti grammaticali o alcune caratteristiche, un lavoro più agevole, consentendo loro di evitare annotazioni manuali. Gli analizzatori sintattici, in uso sia sul Web che su singoli PC, producono una rappresentazione grafica della struttura di una frase che può risultare utile allanalisi grammaticale da parte di studenti di livello avanzato. Lintegrazione delle tecniche HLT nel software CALL è discussa in dettaglio nella Sezione 6.
3. Traduzione automatica
Indice della Sezione 3
3.1 Breve storia della traduzione automatica.
3.2 Pacchetti commerciali di traduzione automatica
La traduzione automatica è il sogno degli ingegneri informatici sin dagli anni quaranta. In questa sezione troverete una breve storia. Per iniziare, siete invitati a consultare la seguente pubblicazione in rete che fornisce un'introduzione molto utile alla traduzione automatica:
Arnold D., Balkan L., Meijer S., Humphreys R.L. e Sadler L. (1994), Machine Translation: an introductory guide.
http://clwww.essex.ac.uk/~doug/book/book.html
3.1 Breve storia della traduzione automatica
Il lavoro iniziale sui sistemi di traduzione automatica è stato caratterizzato da un approccio, che ora definiremmo ingenuo, al "problema" della traduzione dei linguaggi naturali. L'efficace decodifica dei messaggi cifrati da parte delle macchine durante la Seconda Guerra Mondiale portò alcuni scienziati, soprattutto Warren Weaver, a considerare il processo di traduzione sostanzialmente analogo alla decodifica. In una lettera scritta nel 1947 a Norbert Wiener del MIT, Weaver (allora direttore della Rockfeller Foundation) avanzò l'ipotesi di una traduzione automatica:
"Quando guardo un articolo in russo, mi dico 'In realtà è scritto in inglese, ma è stato codificato in simboli strani. Ora lo decodificherò ."
Forse Weaver è rimasto scornato dalla risposta pessimista di Wiener
"Francamente ho paura che i confini delle parole nelle diverse lingue siano troppo vaghi e le connotazioni emotive e intenzionali troppo estese per rendere augurabile qualsiasi schema quasi meccanico di traduzione."
ma non si scompose e invece realizzò il suo famoso memorandum 1949, che inviò a 200 menti illustri del tempo. Poneva l'esigenza e la possibilità di una traduzione automatica. Così cominciò la prima era della ricerca sulla TA.
La prima generazione (d'ora innanzi 1G) dei sistemi di traduzione automatica si basava sul principio del trasferimento diretto, cioè il percorso dal testo in lingua d'origine al suo equivalente nella lingua obiettivo era breve. Consisteva infatti in due processi: sostituzione e adeguamento. Il sistema diretto comprendeva un dizionario bilingue che conteneva le sostituzioni potenziali o gli equivalenti nella lingua obiettivo per ogni parola nella lingua d'origine. Un limite di tali sistemi era dunque la loro unidirezionalità. Inoltre non potevano gestire molte lingue a differenza dei sistemi che vennero in seguito. Erano state incorporate delle regole per la scelta delle sostituzioni corrette, ma funzionavano a un livello base; sebbene ci fosse una qualche analisi grammaticale all'inizio, prima della ricerca sul dizionario, del successivo riordino locale e della produzione finale del testo obiettivo, non era prevista l'analisi del periodo per non parlare poi di quella semantica! Inevitabilmente tutto ciò si traduceva spesso in un risultato di qualità scadente, il che certamente ha contribuito alle critiche severe della traduzione automatizzata nel rapporto del 1966 del Automatic Language Processing Advisory Committee (ALPAC), in cui si affermava che si intravedevano scarse possibilità d'uso per la traduzione automatica nel prossimo futuro. Il giudizio di condanna del rapporto ALPAC in effetti bloccò l'erogazione di fondi per la ricerca sulla traduzione automatica negli Stati Uniti per tutti gli anni 60 e 70. Possiamo dire che i sistemi di traduzione automatica sono stati ostacolati sia da limiti tecnici che dalla mancanza di una base linguistica. Il sistema elaborato all'Università di Georgetown, Washington, la cui prima dimostrazione si ebbe all'IBM a New York nel 1954, non presentava una netta separazione tra la conoscenza della traduzione e gli algoritmi sottostanti all'elaborazione, il che rendeva difficili le modifiche al sistema.
Nel periodo che seguì il rapporto ALPAC si avvertì sempre di più l'esigenza di un approccio alla progettazione di un sistema di traduzione automatica che evitasse molte trappole dei sistemi della 1G. L'opinione si era ormai indirizzata verso l'idea che gli sviluppi linguistici dovessero influenzare la progettazione e l'elaborazione dei sistemi. Si può dire davvero che la seconda generazione (2G) dei sistemi "indiretti" doveva molto alle teorie linguistiche del tempo. La modularità è un'importante caratteristica di progettazione dei sistemi della 2G, e in contrasto con i sistemi della 1G, che operavano su un principio di "forza bruta", vale a dire in cui la traduzione avveniva tutta in una volta, le fasi coinvolte nell'analisi del testo di origine e nella produzione del testo obiettivo costituivano idealmente processi distinti. I sistemi della 2G possono essere sostanzialmente divisi in sistemi "interlingue" e "di trasferimento". Diamo prima di tutto un'occhiata ai sistemi interlingue, o meglio a quelli che sostengono di adottare un approccio interlingue. Nella sua lettera a Norbert Wiener, Warren Weaver aveva avanzato l'idea di una lingua "universale" intermedia come possibile percorso verso la traduzione automatizzata. Tuttavia, la linguistica non fu in grado di fornire modelli da applicare fino agli anni 60. In virtù dell'introduzione del concetto di "struttura profonda", la teoria chomskiana di grammatica generativa trasformazionale sembrò indicare la strada verso rappresentazioni semantiche "universali" e quindi sembrò fornire un modello per la struttura di una cosiddetta interlingua. Un'interlingua non è una lingua naturale, la si può vedere piuttosto come una rappresentazione di significato che è indipendente dall'origine ma anche dalla lingua obiettivo della traduzione. Un sistema interlingue va dalla struttura di superficie di una lingua all'interlingua e viceversa. Un approccio alla progettazione del sistema, che sia veramente interlingue, ha degli ovvi vantaggi, il più importante dei quali è l'economia. Infatti una rappresentazione interlingue può essere applicata a qualsiasi coppia di lingue e agevola l'aggiunta di altre coppie di lingue senza modifiche importanti al sistema. Ci occupiamo ora dei sistemi "di trasferimento".
In un modello di trasferimento la rappresentazione intermedia è lingua-dipendente, essendoci un modulo bilingue, la cui funzione è di interporre tra la lingua d'origine e la lingua obiettivo le rappresentazioni intermedie. Ed ecco perché non possiamo dire che il modulo di trasferimento sia indipendente dalla lingua. La natura di questi moduli di trasferimento ha delle ovvie ramificazioni per la progettazione del sistema, in quanto l'aggiunta di un'altra lingua ad un sistema ha bisogno non solo di moduli per l'analisi e la sintesi ma anche di moduli di trasferimento aggiuntivi, il cui numero è determinato dal numero di lingue presenti nel sistema esistente e che aumenterebbe in via polinomica a seconda del numero di lingue aggiuntive richieste. (Per n lingue il numero di moduli di trasferimento necessari sarebbe n(n-1) o n(n-1) /2 se i moduli sono reversibili).
Un progresso importante nei sistemi della 2G rispetto alla 1G fu la separazione degli algoritmi (software) dai dati linguistici (lingware). In un sistema sul modello Georgetown il programma mescolava il trattamento della lingua, la traduzione e il processo in un unico programma. Il programma era quindi monolitico ed era facile introdurvi errori quando si cercava di rettificare una carenza esistente. Il progresso verso la separazione di software e lingware fu accelerato dal progresso parallelo nelle tecniche computazionali e linguistiche. L'adozione di formalismi linguistici nella progettazione dei sistemi e lo sviluppo di linguaggi di programmazione di alto livello consentì sa chi lavorava sulla traduzione automatica di codificare in modo più orientato verso i problemi. Lo sviluppo nei linguaggi di programmazione voleva dire che stava diventando sempre più facile codificare regole per la traduzione in modo significativo e possibilmente migliorava la qualità delle regole stesse. La natura dichiarativa della descrizione linguistica poteva ora riflettersi in modo molto più esplicito nella progettazione dei programmi per la traduzione automatica.
Alcuni approcci correnti alla traduzione automatica fanno un minor affidamento sulle descrizioni linguistiche formali dell'approccio di trasferimento di cui abbiamo parlato. Per esempio, la traduzione automatica basata sui modello (EBMT) non utilizza il confronto tra le lingue ma abbina modelli di traduzione in memoria l'uno con l'altro usando un corpus bilingue di coppie di traduzione ( si veda il Capitolo 10 di Arnold et al., 1994). Un approccio ancora più radicale alla traduzione automatica è l'approccio statistico (si veda Brown et al., 1993), che richiede l'uso di vasti corpora bilingue che fungono da input per un modello statistico di traduzione. E a questo punto, abbiamo fatto la quadratura del cerchio, in quanto le idee di Weaver di applicare tecniche statistiche sono viste come base proficua per la traduzione automatica.
3.2 Pacchetti commerciali per la traduzione automatica
Sul mercato esistono molti pacchetti per traduzioni a basso costo. Se questi pacchetti possono essere utili per capire il senso di un testo, non devono tuttavia essere considerati dei sostituti efficaci del traduttore umano. Non possono infatti analizzare sintatticamente in modo affidabile il linguaggio naturale. Systran (conosciuto adesso con il nome di Babelfish) è disponibile in rete tramite Altavista: http://babelfish.altavista.digital.com. Non è poi così male; Le sue traduzioni sono comprensibili a metà, ma riescono a far capire se vale la pena tradurre un testo correttamente. I traduttori professionisti usano pacchetti a memoria di traduzione per esempio SDLX, che è stato sviluppato dalla SDL, azienda specializzata nella traduzione di manuali tecnici e nella "localizzazione" del software: http://sdlx.sdlintl.com
Un altro approccio alla traduzione è la banca di espressioni memorizzate, per esempio LinguaWrite, che è rivolta all'utente del mondo degli affari e contiene un ampio database di espressioni e frasi equivalenti in diverse lingue per agevolare la scrittura di lettere commerciali.
4. Introduzione alla tecnologia del parlato
I computer di solito sono accompagnati da una periferica standard di ingresso - la tastiera - e due periferiche standard di uscita - il monitor e la stampante. Tutte e tre limitano l'ingresso e l'uscita della lingua al testo scritto. Tuttavia, ci sono sempre più elementi hardware e programmi informatici che consentono alla macchina di elaborare dati orali. I PC multimediali sono abbastanza potenti da consentire all'utente di collegare un microfono alla scheda audio e registrare la propria voce. Anche un registratore può essere collegato al computer e i suoni registrati su nastro vengono trasmessi al computer che li digitalizza. La memorizzazione di questi file audio non è più problematica, grazie a dischi fissi sempre più capaci (e alla riduzione del loro prezzo) e al miglioramento degli algoritmi di compressione per questo tipo di dati.
Uno sviluppo più interessante è che ora vi è del software in grado di elaborare un input parlato, che viene analizzato secondo un'ampia gamma di parametri e la sua analisi può venire rappresentata graficamente o numericamente. Date un'occhiata al risultato di questo software di analisi del parlato sul sito http://agoralang.com/signalyze.html. Naturalmente questo tipo di risultato grafico non ha utilità immediata per l'osservatore non iniziato, e quindi non sosteniamo che una tale rappresentazione grafica si dimostri utile per lo studente di lingue. D'altro canto gli specialisti sono ben in grado di interpretare questi dati di analisi del parlato. Si veda:
http://cslu.cse.ogi.edu/tutordemos/SpectrogramReading/spectrogram_reading.html per i dettagli e per alcune spiegazioni sulle diverse analisi.
Le informazioni ottenute dall'analisi del parlato si sono dimostrate davvero molto preziose per il riconoscimento e la sintesi del parlato. Per riconoscimento del parlato si intende la trasformazione di un input orale in un output scritto; la sintesi del parlato è la conversione da testo a parlato. Quest'ultimo tipo di software è solitamente conosciuto come software "text to speech" o TTS.
Attualmente
la sintesi è molto più avanzata del riconoscimento. La precisione e la naturalezza
delle espressioni prodotte artificialmente è notevole. Anche il software disponibile
come shareware (software condiviso) ottiene risultati molto buoni. Si
veda per esempio Winspeech sul sito http://www.pcww.com.
La sintesi del parlato è ovviamente più complicata del semplice abbinamento
di caratteri a suoni, perché molto spesso non esiste relazione uno-a-uno. Per
riprodurre il parlato naturale, si deve anche tenere presente l'intonazione
di particolari tipi di frasi, il ritmo che hanno particolari espressioni. Gli
esempi forniti sulle pagine del Laboratori Bell mostrano che gli acronimi e
le cifre provocano le maggiori difficoltà. La sintesi del parlato può essere
effettuata direttamente dalla pagina web http://www.bell-labs.com
Date un'occhiata in particolare a http://www.bell-labs.com/project/tts.
Come potete vedere da questi esempi la tecnologia per la sintesi del parlato
ha certamente raggiunto un livello di produzione e solidità adeguato per venire
integrata nel processo di apprendimento della lingua. Questa tecnologia può
venire collegata a qualsiasi input scritto in varie lingue, per esempio la pronuncia
automatica di parole tratte da un dizionario on-line, la lettura a voce alta
di un testo
.
Il riconoscimento del parlato - il processo di conversione di un segnale acustico, catturato da un microfono o da un telefono, in una serie di parole - non ha raggiunto un livello di resa altrettanto elevato.
"La precisione del software per il riconoscimento del parlato delle generazioni passate non andava oltre il 90% (quasi un errore ogni dieci parole), rendendolo quindi discutibile come strumento per l'innalzamento della produttività. La buona notizia che riguarda il più recente software del parlato è che gran parte dei prodotti danno una precisione nel riconoscimento superiore al 95% e quindi aiutano a fare di più in meno tempo - purché si abbia una velocità del PC sufficiente, una scheda audio e un microfono adeguati e l'abilità di parlare chiaro in qualsiasi momento." (Alwang, 1999)
Il riconoscimento del parlato sembra molto più complesso e entusiasmante della sintesi. Questa tecnologia si basa soprattutto sull'analisi del parlato già menzionata. Se si ricorda che ciascuno dei parametri analizzati poteva essere stato influenzato da qualche rumore di fondo indipendente dal parlatore o da qualche caratteristica di pronuncia idiosincratica di costui, allora diventa chiaro quanto sia difficile l'interpretazione dei dati di analisi per un programma di riconoscimento del parlato. Il problema è aumentato dal fatto che normalmente le parole non compaiono isolate - sono di solito pronunciate in quello che chiamiamo un discorso collegato, cioè la pronuncia di una parola può influenzarne un'altra, l'intonazione e il ritmo hanno una ricaduta su come una singola parola sarà pronunciata. Tuttavia, da un po' di tempo esiste sul mercato del software commerciale che fa buon uso di questa nuova tecnologia. La DynEd - uno degli editori di questo software per l'apprendimento linguistico - così si esprime riguardo all'uso del riconoscimento del parlato nel software per l'apprendimento linguistico:
"La tecnologia del riconoscimento del parlato è finalmente maturata - almeno per gli obiettivi della formazione linguistica per giovani adulti e adulti. I programmi informatici che veramente "capiscono" il parlato naturale, il Santo Graal dei ricercatori sull'intelligenza artificiale sono lontani ancora almeno un decennio, e i programmi RP (riconoscimento del Parlato) di oggi sono soltanto strumenti di combinazione schemi, ancora non in grado di analizzare sintatticamente la lingua reale, di ottenere qualcosa di simile alla "comprensione"; tuttavia, possono ora fornire agli studenti di lingue una pratica del parlato realistica, molto efficace e motivante.
( )
L'essenza della lingua reale non risiede nelle parole singole discrete - gli studenti di lingue hanno bisogno di praticare espressioni e frasi complete in contesti realistici. Inoltre, i programmi che erano concepiti per accettare le idiosincrasie di pronuncia individuali di un parlante non erano l'ideale per aiutare gli studenti a progredire verso una pronuncia più standardizzata. Queste tecnologie fallivano anche se la voce del parlante cambiava per raffreddori, laringiti e altre malattie della gola. Ciò le rendeva inutilizzabili finché il parlante non si ristabiliva o ritarava il modello del parlato.
La soluzione a questi problemi venne con lo sviluppo di motori continui per il riconoscimento del parlato che fossero indipendenti dal parlante. Questi programmi sono in grado di gestire frasi complete pronunciate ad un ritmo naturale e non soltanto parole isolate. Non necessitano di hardware speciale, sono abbastanza piccoli e veloci per lavorare su un normale PC e, cosa importante per il tipo ambiente formativo linguistico, non hanno bisogno di un periodo di formazione. Consentono a vari studenti di lingua individuali che lavorano allo stesso computer di praticare l'inglese parlandolo sin dal primo momento che parlano nel microfono.
( )
Una tale flessibilità per quanto riguarda i paradigmi di pronuncia significa che attualmente i programmi RP indipendenti dal parlante non sono ideali per la pratica diretta della pronuncia. Tuttavia, è dimostrato che quegli esercizi che si focalizzano sulla fluency e sulla costruzione della frase, e con modelli di lingua parlata originale che si sentono subito dopo che le parole dello studente sono state riconosciute correttamente, hanno indirettamente favorito un miglioramento di pronuncia. Un altro compromesso è che la maggiore flessibilità e tolleranza che consentono a questi programmi di "riconoscere" frasi dette da studenti con un'ampia gamma di diversi accenti, ne limitano anche l'accuratezza, soprattutto per quelle parole ed espressioni che hanno un suono simile. Alcuni errori possono venire accettati perché interpretati come corretti.
I parlanti madrelingua che testano la "comprensione" dei programmi "sintonizzati" sui bisogni dei parlanti non madrelingua possono avere dei problemi, ma la maggior parte degli insegnanti, dopo un attento esame dei diversi bisogni e della psicologia dei parlanti e degli studenti madrelingua, accettano il compromesso. Gli studenti non si aspettano di essere capiti sempre. Se gli si chiede di tanto in tanto di ripetere una frase che il programma non ha riconosciuto o ha mal interpretato, possono sentirsi un po' frustrati, ma è più facile che mettano in conto queste débacle nel loro percorso gli studenti di lingua piuttosto che i parlanti madrelingua. D'altro canto, se il programma "capisce" questi studenti, per quanto abbiano una pronuncia imperfetta, di solito hanno un grande senso di soddisfazione, un fattore positivo che i parlanti madrelingua non possono apprezzare allo stesso modo. La cosa peggiore per uno studente è un programma troppo esigente in termini di perfezione. I programmi di questo tipo rapidamente portano alla frustrazione o alla riluttanza imbarazzata ed esitante a parlare inglese che è tipica di molte classi. Anche se accettiamo che l'accuratezza deve essere subordinata al grado di competenza per favorire l'espressione orale degli studenti, dobbiamo in quanto insegnanti, preoccuparci che non vi sia reiterazione degli errori. (http://www.dyned.com/dyned/eng/sr.htm).
Per ulteriori informazioni e link in riferimento alla tecnologia del parlato, date un'occhiata al sito InSTIL (Integrating Speech Technology in (Language) Learning / L'integrazione della tecnologia del parlato nell'apprendimento (linguistico)): http://dbs.tay.ac.uk/instil.
5. L'analisi sintattica e l'etichettatura in TAL
Indice della Sezione 5
5.1 Gli elementi essenziali dell'analisi sintattica
5.1.1 Top down (in profondità)
5.1.2 Bottom up (in ampiezza)
5.1.3 L'analisi di input non corretto
5.1 Gli elementi essenziali dell'analisi sintattica
Nella sezione vengono delineati gli elementi essenziali dell'analisi sintattica, prima di tutto attraverso la descrizione dei componenti di un sistema di analisi e quindi attraverso la discussione di diversi tipi di analizzatori. Considereremo un fenomeno linguistico che provoca problemi per l'analisi sintattica e infine prenderemo in esame soluzioni potenziali alle difficoltà che si sono venute a creare con l'analisi.
Per dirla in parole povere, l'analizzatore sintattico è un programma con cui si ottiene una descrizione sintattica di una lingua. I componenti fondamentali di cui ha bisogno un analizzatore sintattico sono un dizionario contenente parole che possano essere analizzate e una grammatica, consistente nelle regole che determinano le strutture grammaticali. I primi analizzatori furono sviluppati per l'analisi dei linguaggi di programmazione; è chiaro che trattandosi di linguaggi artificiali e regolari presentano meno problemi di una lingua naturale. E' molto utile pensare all'analizzatore come ad un problema di ricerca che deve essere risolto. Si può risolvere usando un algoritmo che si può definire come "una procedura formale che sempre produce un risultato corretto o ottimale. L'algoritmo applica una procedura step-by-step che garantisce un risultato specifico o risolve uno specifico problema. La procedura di un algoritmo esegue un calcolo in un lasso di tempo finito. I programmatori indicano l'algoritmo che il programma seguirà quando sviluppano un programma convenzionale" (Smith 1990).
Gli algoritmi di analisi sintattica definiscono una procedura che ricerca la combinazione ottimale delle regole grammaticali che generano una struttura ad albero per la frase in ingresso. Come si potrebbero definire queste regole grammaticali in modo conciso compatibile con l'elaborazione informatica? Un costrutto utile ai nostri scopi è la cosiddetta grammatica acontestualizzata (CFG = context-free grammar). La CFG consiste di regole che contengono un simbolo unico a sinistra e uno o più a destra. Per esempio, l'affermazione che dice che una frase può essere composta da:un'espressione nominale e un'espressione verbale possono essere espressi dalla seguente regola di riscrittura
F ® SN SV
Ciò significa che una frase S può essere "riscritta" sotto forma di espressone nominale SN seguita da un'espressione verbale SV, che sono a loro volta definite nella grammatica. Un'espressione nominale, per esempio, può essere composta da un determinante DET e un sostantivo N. Questi simboli sono conosciuti come non-terminali e le parole rappresentate da questi simboli sono simboli terminali.
Gli algoritmi di analisi sintattica possono procedere top-down o bottom-up. In alcuni casi gli algoritmi top-down e bottom-up possono essere combinati. Quelle che seguono sono semplici descrizioni di due strategie di analisi sintattica.
5.1.1 Top Down (in profondità)
La strategia top-down parte dai simboli non terminali:
F ® SN SV
e poi li divide in costituenti. Questa strategia ipotizza che abbiamo una F e cerca di trovarla. Se scegliamo di ricercare in primo luogo in profondità, allora procediamo verso il basso da una parte dell'albero alla volta. La ricerca riuscirà se potrà dividere la frase in tutti i simboli terminali (parole).
5.1.2 Bottom Up (in ampiezza)
Un strategia bottom up esamina gli elementi di una F e vi assegna delle categorie per formare dei costituenti più ampi fino ad arrivare ad una F. Se scegliamo di ricercare in primo luogo in ampiezza, allora procediamo consecutivamente attraverso ogni strato e ci fermiamo non appena abbiamo costruito una frase.
Guardiamo ora un fenomeno linguistico che è fonte di problemi per gli analizzatori sintattici - la cosiddetta ambiguità strutturale Esaminate la frase seguente:
The man saw the man in the park with a telescope
E' facile notare che vi sono una serie di interpretazioni possibili, per esempio il telescopio potrebbe essere lo strumento usato per vedere il secondo uomo oppure "in the park with a telescope" potrebbe definire il parco, per esempio "quello con un telescopio". Il risultato dell'analizzatore sintattico può essere rappresentato come una lista tra parentesi o, più comunemente, una struttura ad albero. Ecco il risultato di due analisi possibili della frase.
Figura 1: Risultato della prima interpretazione

Figura 2: Risultato della seconda interpretazione

Un modo di affrontare il problema delle frasi che hanno più di un'analisi possibile è concentrarsi su elementi specifici dell'input da analizzare e non considerare i fenomeni come l'ambiguità strutturale. Idealmente ci aspettiamo che un parser riesca nell'analisi di una frase sulla base della sua grammatica, ma spesso vi sono problemi causati da errori nel testo o da incompletezza della grammatica e del dizionario. Anche la lunghezza delle frasi e l'ambiguità delle grammatiche rendono spesso difficile l'analisi sintattica di un testo non limitato. Un approccio che tiene conto di alcune di queste questioni è l'analisi sintattica parziale o superficiale. Abney (1997:125) così descrive in breve l'analisi parziale:
Le tecniche di analisi parziale mirano a recuperare informazioni sintattiche in modo efficiente e affidabile da testi non limitati, sacrificando la completezza e la profondità dell'analisi. Gli analizzatori parziali si focalizzano sul recupero di pezzi di struttura della frase che non hanno bisogni di grandi quantità di informazioni (come le informazioni lessicali); la dipendenza strutturale, per esempio, rimane insoluta. Si vede che in tal modo l'efficienza dell'analisi ha un grande miglioramento.
Un'altra strategia per analizzare la lingua è l'etichettatura delle parti del discorso, in cui non si cerca di trovare strutture più ampie quali le frasi nominali ma invece si etichetta ogni parola all'interno di una frase con la sua parte di parlato appropriata. Per darvi un'idea di come appaia il risultato di un etichettatore, è stato etichettato un paragrafo di questa pagina web usando un etichettatore sviluppato all'Università di Pisa:
http://janet.di.unipi.it/Resource/POS/pos.html
Ecco una frase tratta da questo documento:
La prima generazione dei sistemi di traduzione automatizzata si basava sul principio del trasferimento diretto, cioè il percorso dal testo in lingua d'origine al suo equivalente nella lingua obiettivo era breve. Consisteva infatti in due processi: sostituzione e adeguamento. Il sistema diretto comprendeva un dizionario bilingue che conteneva le sostituzioni potenziali o gli equivalenti nella lingua obiettivo per ogni parola nella lingua d'origine. Un limite di tali sistemi era dunque la loro unidirezionalità. Inoltre non potevano gestire molte lingue a differenza dei sistemi che vennero in seguito
La tabella mostra il risultato dell'etichettatura e si può vedere che molte parole sono state identificate correttamente.
Tabella 1: Risultato dell'etichettatura
| La | DET:def | il |
| prima | ADV | prima |
| generazione | NOM | generazione |
| dei | PRE:det | del |
| sistemi | VER:impe | sistemare |
| di | PRE | di |
| traduzione | NOM | traduzione |
| automatizzata | VER:pper | automatizzare |
| si | PRO | si |
| basava | VER:impf | basare |
| sul | PRE:det | sul |
| principio | NOM | principio |
| del | PRE:det | del |
| trasferimento | NOM | trasferimento |
| diretto | ADJ | diretto |
| , | PON:comma | , |
| cioè | ADV | cioè |
| il | DET:def | il |
| percorso | VER:pper | percorrere |
| dal | PRE:det | dal |
| testo | NOM | testo |
| in | PRE | in |
| lingua | NOM | lingua |
| d' | PRE | d' |
| origine | NOM | origine |
| al | PRE:det | al |
| suo | PRO:poss | suo |
| equivalente | VER:ppre | equivalere |
| nella | PRE:det | nel |
| lingua | NOM | lingua |
| obiettivo | NOM | obiettivo |
| era | VER:aux:impf | essere |
| breve | ADJ | breve |
| . | PON:sep | . |
| Consisteva | VER:impf | consistere |
| infatti | ADV | infatti |
| in | PRE | in |
| due | ADJ | due |
| processi | NOM | processo |
| : | PON:sep | : |
| sostituzione | NOM | sostituzione |
| e | CON:coo | e |
| adeguamento | NOM | adeguamento |
| . | PON:sep | . |
| Il | DET:def | il |
| sistema | NOM | sistema |
| diretto | ADJ | diretto |
| comprendeva | VER:impf | comprendere |
| un | DET:indef | un |
| dizionario | NOM | dizionario |
| bilingue | ADJ | bilingue |
| che | PRO:rela | che |
| conteneva | VER:impf | contenere |
| le | DET:def | il |
| sostituzioni | NOM | sostituzione |
| potenziali | ADJ | potenziale |
| o | CON:coo | o |
| gli | DET:def | il |
| equivalenti | VER:ppre | equivalere |
| nella | PRE:det | nel |
| lingua | NOM | lingua |
| obiettivo | NOM | obiettivo |
| per | PRE | per |
| ogni | ADJ | ogni |
| parola | NOM | parola |
| nella | PRE:det | nel |
| lingua | NOM | lingua |
| d' | PRE | d' |
| origine | NOM | origine |
| . | PON:sep | . |
| Un | DET:indef | un |
| limite | NOM | limite |
| di | PRE | di |
| tali | PRO:demo | tale |
| sistemi | VER:impe | sistemare |
| era | VER:aux:impf | essere |
| dunque | ADV | dunque |
| la | DET:def | il |
| loro | PRO:poss | loro |
| unidirezionalità | NOM | |
| . | PON:sep | . |
| Inoltre | ADV | inoltre |
| non | ADV | non |
| potevano | VER:impf | potere |
| gestire | VER:infi | gestire |
| molte | PRO:indef | molto |
| lingue | NOM | lingua |
| a | PRE | a |
| differenza | NOM | differenza |
| dei | PRE:det | del |
| sistemi | VER:impe | sistemare |
| che | PRO:rela | che |
| vennero | VER:remo | venire |
| in | PRE | in |
| seguito | NOM | seguito |
Come nel caso dell'analisi parziale, non si cerca di trovare categorie sintagmatiche corrette e poiché si tratta di un compito limitato, la percentuale di successo è piuttosto elevata. Le informazioni che vengono dall'etichettatura possono avere input nell'analisi parziale o nel miglioramento della resa degli analizzatori tradizionali. Parte del compito decisionale che riguarda quale sia l'etichetta corretta da attribuire a una parola si basa sulla probabilità dell'occorrenza di due o tre sequenze di parole (digrammi e trigrammi), anche laddove alle parole può essere attribuita più di un valore. Per esempio, nel nostro testo etichettato si verifica la sequenza "Il sistema". Sistema è anche un verbo, ma la probabilità che un determinante (il) sia seguito da un verbo è più bassa della probabilità di una sequenza nominale con determinante. Si veda però più avanti dove abbiamo "tali sistemi". In questo caso l'ambiguità non risolta di tali (pronome o aggettivo) non risolve nemmeno l'ambiguità di sistemi (nome o verbo) dando una etichettatura non corretta.
Per una discussione più dettagliata si veda il Capitolo 10 di Manning & Schütze (1999).
5.1.3 L'analisi di input non corretto
Naturalmente in CALL lavoriamo con testi che sono stati prodotti da studenti di lingua di vari livelli di competenza e accuratezza. Pertanto è ragionevole presumere che l'analizzatore debba essere preparato a gestire errori linguistici a livello di input. Una cosa che si può fare è corredare la nostra grammatica per le frasi corrette con un'altra per le frasi non corrette - una grammatica degli errori, per esempio inserendo errori individuali e/o ricorrenti in un sistema di regole separato. Il vantaggio di questo approccio con la grammatica degli errori è che il feedback può essere molto specifico ed è normalmente piuttosto affidabile perché può essere collegato ad una regola molto specifica. Il grosso svantaggio, tuttavia, è che gli errori del singolo studente devono essere anticipati, cioè ogni errore deve essere coperto da una regola appropriata. Inoltre, come è già stato detto, non è solo nei testi prodotti da studenti di lingua che si trovano strutture errate. La traduzione automatizzata si trova di fronte a problemi simili. Dina & Malnati censiscono gli approcci "che riguardano la progettazione e l'applicazione di grammatiche in grado di gestire un 'input autentico'" (Dina & Malnati 1993:75). Elencano quattro tipi di approccio:
L'approccio basato sulle regole che poggia su due serie di regole: una per l'input grammaticale e l'altra per quello non grammaticale. Dina & Malnati rilevano correttamente che di solito dovrebbero essere sufficienti le condizioni formali e quindi la seconda serie di regole dà luogo a ridondanza linguistica. Il problema principale nell'uso di questo approccio in un sistema CALL basato sugli analizzatori sintattici è quello di dover anticipare i probabili errori degli studenti.
L'approccio basato sulle metaregole usa una serie di regole formali e se non se ne può applicare nessuna richiama un algoritmo che allenta alcune restrizioni e registra il tipo di violazione. Dina & Malnati osservano che l'algoritmo provoca problemi quando si trova di fronte a errori multipli - cosa molto probabile in qualsiasi testo prodotto da uno studente di lingue.
L'approccio basato sulla preferenza comprende una grammatica ipergenerativa e una serie di regole di preferenza. " ogni volta che una condizione formale viene rimossa da una regola di base per rendere più ampio il suo contesto di applicazione, si deve aggiungere alla grammatica una regola di preferenza. Questa regola p deve essere in grado di coprire - nel contesto della regola di base - la condizione che è stata rimossa in precedenza". (Dina & Malnati 1993: 78). Ecco di nuovo una fonte di ridondanza linguistica che potrebbe dare luogo a incoerenze grammaticali. Essi sostengono che a causa dell'ipergenerazione di interpretazioni possibili, "il sistema sarebbe completamente impossibile da usare in un contesto di applicazione". (ibid.: 79)
L'approccio basato sulle restrizioni poggia sulle seguenti ipotesi:
ogni (sotto)albero è contrassegnato da un indice di errore (inizialmente fissato a 0);
la violazione di una restrizione in una regola non blocca l'applicazione, ma aumenta l'indice di errore del (sotto)albero generato;
alla fine dell'analisi sintattica viene scelto l'oggetto contrassegnato dall'indice più piccolo.
Di conseguenza l'"interpretazione più plausibile di una frase è quella che soddisfa il più ampio numero di restrizioni" (Dina & Malnati 1993: 80).
Concludono che "l'analisi basata su una restrizione debole si è dimostrata utile per l'aumento della solidità di un sistema di analisi del linguaggio naturale (NLP)" (Dina & Malnati 1993: 88). Basano le loro conclusioni sulle seguenti caratteristiche vantaggiose dell'approccio: non ridondanza, meccanismo di preferenza inserito, globalità, efficienza, flessibilità linguistica.
6. HLT e CALL
Abbiamo visto nella Sezione 3 che la traduzione automatica (TA) e l'interesse politico e scientifico hanno giocato un ruolo importante nell'accettazione (o non accettazione) e nello sviluppo generale del Trattamento Automatico del Linguaggio.
"Nel 1964 però la promessa di sistemi operativi di traduzione automatica sembrava ancora lontana e gli sponsor hanno costituito un comitato, che nel 1966 raccomandava che i finanziamenti per la traduzione automatica fossero ridotti. Ciò mise fine a un decennio di intensa attività di ricerca in questo campo". (Hutchins 1986: 39)
Forse non sorprende quindi che la metà degli anni sessanta abbia visto la nascita di un'altra disciplina - l'Apprendimento delle Lingue Assistito dal Computer (CALL). Il Progetto PLATO è considerato l'inizio di CALL. PLATO IV è stata probabilmente la versione di questo progetto (su computer mainframe) che ha avuto l'impatto più forte sullo sviluppo di CALL. Contemporaneamente, un'altra università americana, la Brigham Young University, riceveva fondi governativi per un progetto CALL, TICCIT (Time-Shared, Interactive, Computer Controlled Information Television) (Levy 1997:18). Altri programmi ancora conosciuti e usati, per esempio per il tedesco, furono sviluppati poco dopo: CALIS, Computer Aided Language Instruction System, alla Duke University (Borchardt 1995) e TUCO alla Ohio State University. In Gran Bretagna John Higgins sviluppò Storyboard negli anni ottanta, un programma per la ricostruzione del testo per microcomputer. "Altri programmi come Fun with Texts (Camsoft) ampliarono notevolmente l'idea della ricostruzione totale del testo con l'aggiunta di ulteriori attività". (Levy 1997: 25)
In anni recenti lo sviluppo di CALL è stato molto influenzato dalla tecnologia, dalla nostra conoscenza e dalla nostra expertise, cosicché non solo la progettazione di larga parte del software CALL, ma anche la sua classificazione, è guidata dalla tecnologia. Una classificazione che tiene conto dei più recenti sviluppi nella Tecnologia dell'Informazione e negli standard europei è stata fornita da Wolff (1993:21), che distingue cinque gruppi di applicazioni:
applicazioni per l'apprendimento tradizionale delle lingue assistito dal computer
applicazioni per l'intelligenza artificiale (corsivo nostro)
applicazioni di utilità (strumenti e sistemi di aiuto)
applicazioni multimediali
applicazioni per la comunicazione
La fine degli anni ottanta ha visto l'inizio di tentativi che sono in gran parte riassunti sotto l'acronimo ICALL (CALL intelligente), "un misto di tecniche di AI (Intelligenza Artificiale) e CALL" (Matthews 1992b:i). Bowerman (1993:31) osserva che "Weischedel et al. (1978) hanno prodotto il primo sistema ICALL [CALL intelligente] che gestiva esercizi di comprensione. Faceva uso di conoscenze semantiche e sintattiche per controllare le risposte degli studenti a domande di comprensione". Per quanto se ne può sapere, fu solo la prima rondini che non ha fatto primavera. Krüger-Thielmann (1992: 51segg.) elenca e riassume questi primi progetti in ICALL. ALICE, ATHENA, BOUWSTEEN & COGO, EPISTLE, ET, LINGER, Menzel, Schwind, VP2, XTRA-TE, Zock. Matthews (1993:5) identifica la Teoria Linguistica e l'Acquisizione della Seconda Lingua come le due discipline principali che compongono il CALL intelligente e sono (o saranno) sviluppate dal CALL intelligente e aggiunge "le aree evidenti di ricerca sull'Intelligenza Artificiale da cui ICALL dovrebbe poter trarre gli spunti principali sono l'Elaborazione del Linguaggio Naturale (in inglese NLP = Natural Language Processing) e i Sistemi di Tutorato Intelligente (ITS)" (Matthews 1993:6). Matthews dimostra che è possibile "pensare ad un sistema ICALL in termini della classica architettura degli ITS" (ibid.). Il sistema consiste in tre moduli - esperto, studente e insegnante - e un'interfaccia. Il modulo esperto è quello che "ospita" la conoscenza della lingua da parte del sistema. E' questa parte che può elaborare qualsiasi testo prodotto da uno studente - in un sistema ideale. Ciò viene fatto di solito con l'aiuto di un qualche tipo di analizzatore sintattico. "L'uso degli analizzatori in CALL viene comunemente definito CALL intelligente o 'ICALL'; più correttamente lo si potrebbe descrivere come CALL basato sugli analizzatori sintattici (corsivo nostro), perché la sua "intelligenza" risiede nell'uso dell'analisi - una tecnica che consente al computer di codificare complesse conoscenze grammaticali quali sono quelle che gli uomini usano per costruire frasi, riconoscere errori e fare correzioni" (Holland et al. 1993:28). Questa nozione di CALL basato sugli analizzatori sintattici non soltanto carpisce la natura del settore molto meglio del termine "CALL intelligente" che può indurre in errore (tutto l'altro CALL non è quindi intelligente?), identifica anche l'uso delle Trattamento Automatico della Lingua come un approccio possibile all'interno di CALL parallelo ad altri, quali CALL multimediale e CALL basato sul WEB. In tal modo identifica il CALL basato sugli analizzatori sintattici come una possibilità in evoluzione per il CALL stesso. In alcuni casi, i confini (tecnologicamente definiti) tra questi sotto-settori di CALL non sono chiaramente identificabili, come vedremo in alcuni dei progetti di cui si parlerà nei paragrafi successivi. Per esemplificare i progressi recenti nell'uso sofisticato del Trattamento Automatico del Linguaggio all'interno di CALL, diamo un'occhiata ad alcuni progetti che sono stati presentati a due convegni alla fine degli anni novanta. Il primo è Language Teaching and Language Technology tenutosi a Groningen nel 1997 (Jager et al.: 1998). Carson-Berndsen (1998) ha discusso Apron (Autosegmental Pronunciation Teaching), che usa una base di conoscenze fonologiche e genera "strutture di eventi per qualche espressione" (op. cit.:15) e può, per esempio, visualizzare i processi di pronuncia di singoli suoni e espressioni ben formulate usando un tratto vocale schematico animato. Witt e Young (1998), d'altro canto, si preoccupano della valutazione della pronuncia. Hanno attuato e testato un algoritmo per attribuire un punteggio alla pronuncia che si basa sul riconoscimento del parlato e usa i modelli nascosti di Markov. "Il risultato dimostra che - almeno per questa impostazione con errori di pronuncia generati artificialmente - il metodo GOP (correttezza della pronuncia) per l'attribuzione del punteggio è uno strumento di valutazione praticabile". Un terzo intervento sulla pronuncia a questo convegno, di Skrelin e Volskaja (1998) descriveva l'uso della sintesi del parlato nell'apprendimento della lingua e mette il dettato, la distinzione degli omografi, un dizionario fonetico e esercizi strutturali di pronuncia tra le possibili applicazioni.
Vari interventi a questo convegno si basano sui risultati del progetto GLOSSER, un progetto COPERNICO mirato a dimostrare l'uso degli strumenti di elaborazione del linguaggio (Locolex, , analizzatore morfologico e un disambiguatore della struttura sintagmatica del Centro Ricerche della Rank Xerox, dizionari elettronici importanti, quali Hedendaag Frans, e accesso a corpora bilingui). "Il progetto globale prevede due aree principali in cui possono venire usate le applicazioni GLOSSER. In primo luogo, l'apprendimento linguistico e poi come strumento per quegli utenti che abbiano una minima conoscenza di una lingua straniera ma non la sanno leggere correntemente" (Dokter e Nerbonne 1998:88). Dokter e Nerbonne (1998) parlano del demo francese-olandese che gira sotto UNIX. Il demo
usa l'analisi morfologica per fornire informazioni grammaticali aggiuntive su singole parole e per semplificare la consultazione del dizionario;
si basa su una selezione automatica delle parole;
offre l'opportunità di inserire glosse (prese dalla consultazione del dizionario) nel testo;
si basa sulla rimozione dell'ambiguità del senso di una parola basandosi sullestringhe ("Ogniqualvolta si trova nel testo un contesto lessicale che compare anche nel dizionario, l'esempio nel dizionario viene selezionato". (op.cit.: 93)).
Roosma e Prószéky (1998) focalizzano l'attenzione sul fatto che GLOSSER funziona con i seguenti abbinamenti di lingue: inglese-estone-ungherese, inglese-bulgaro, francese-olandese e descrivono una versione demo che gira sotto Windows. Dokter, Nerbonne, Schürcks Grozeva e Smit (1998) concludono nel loro studio da utenti "che Glosser-RuG migliora la facilità con cui gli studenti di lingue possono accostarsi a un testo in lingua straniera" (op.cit.: 175).
Altri progetti CALL che esplorano l'uso della tecnologia per l'elaborazione del linguaggio sono RECALL (Murphy et al. 1998; Hamilton 1998), "un'applicazione per la correzione degli errori basata sulla conoscenza" (Murphy et al. 1998:62) per l'inglese e il tedesco, e lo sviluppo di strumenti per l'apprendimento della lingua basca come lingua straniera (Diaz de Ilarranza et al. 1998).
Quest'ultimo progetto si basa su un correttore ortografico, un analizzatore morfologico, un analizzatore sintattico e un database lessicale della lingua basca e gli autori riferiscono sullo sviluppo di un modello interlingue.
Ad un altro convegno che ha visto riuniti un gruppo di ricercatori che stanno esplorando l'uso di TAL nel software CALL (Schulze et al.: 1999), Tschichold (1999) ha discusso le strategie per il miglioramento della percentuale di successo dei correttori grammaticali. Menzel e Schröder (1999) hanno descritto la diagnosi dell'errore in una rappresentazione multilivello. La demo presentata carpisce le relazioni tra le entità in un semplice scenario cittadino. Le informazioni sintattiche, semantiche e pragmatiche disponibili vengono controllate simultaneamente alla ricerca di violazioni di restrizioni, per esempio errori fatti dagli studenti di lingue. Visser (1999) ha presentato CALLex, un programma per l'apprendimento del vocabolario basato su funzioni lessicali. Diaz de Ilarraza et al. (1999) hanno descritto gli aspetti di IDAZKIDE, un ambiente di apprendimento per gli studenti spagnoli della lingua basca. Il programma contiene i seguenti moduli: strumenti linguistici ad ampia copertura (database lessicale con 65.000 voci; correttore ortografico; un suggeritore della forma di una parola e un analizzatore morfologico), un'interfaccia utente adattiva e un sistema adattabile dallo studente. Il modello della conoscenza linguistica degli studenti, cioè la loro interlingua, si basa sull'analisi di un corpus (300 testi prodotti da studenti della lingua basca). Foucou e Kübler (1999) hanno presentato un ambiente basato sul Web per insegnare inglese tecnico a studenti di Informatica. Ward et al. (1999) hanno dimostrato che le tecniche per l'elaborazione del linguaggio naturale insieme ad una interfaccia grafica possono venire usate per produrre giochi linguistici significativi. Davies e Poesio (1998) hanno riferito di test su semplici prototipi CALL che sono stati creati usando CSLUrp, un sistema autore grafico per la creazione di sistemi di dialogo parlato. Sostengono che poiché è evidente che i sistemi di dialogo attuali si possono utilizzare nel software CALL, è ora possibile e necessario studiare l'integrazione del feedback correttivo in questi sistemi. Mitkov (1998) ha descritto lo stadio iniziale di un nuovo progetto CALL, The Language Learner's Workbench. Obiettivo del progetto è incorporare vari strumenti HLT già disponibili e di farne un pacchetto per gli studenti di lingue.
Questi esempi recenti di applicazioni CALL che usano il Trattamento Automatico della Lingua non sono assolutamente esaurienti. Non solo illustrano che la ricerca nel campo TAL all'interno di CALL è viva, ma anche che il TAL ha un importante contributo da dare nello sviluppo futuro di CALL. Naturalmente le due discipline sono ancora piuttosto giovani e molti progetti nei due campi, CALL e TAL, non hanno ancora raggiunto lo stadio della messa in atto di un prototipo completamente funzionante. Tuttavia i progetti CALL riusciti in cui venivano utilizzati i vantaggi di TAL (e evitate alcune trappole) sono una testimonianza del fatto che queste nuove tecnologie del linguaggio hanno molto da offrire per lo sviluppo del software CALL che gli studenti potranno usare con più facilità, più efficacemente e più naturalmente.
Vari pacchetti CALL che usano il riconoscimento del parlato hanno raggiunto il mercato commerciale e vengono usati in modo soddisfacente da studenti di tutto il mondo. La generazione del parlato (certamente a livello di parola) ha conseguito una "chiarezza di pronuncia" che la rende uno strumento praticabile per l'apprendimento linguistico. Gli etichettatori delle parti del discorso hanno raggiunto un livello di accuratezza che li rende utilizzabili nella pre-elaborazione automatica dei testi studente. Gli analizzatori morfologici per varie lingue forniscono automaticamente informazioni grammaticali su lemmi in contesto ed eseguono consultazioni automatiche del dizionario alla ricerca delle possibili forme di parole flesse o derivate. La tecnologia dell'analisi sintattica è in grado di costituire l'ossatura di un correttore grammaticale per gli studenti di lingue straniere, un correttore che, naturalmente, è ben lungi dall'essere perfetto, ma è chiaramente superiore a molti correttori grammaticali attualmente in commercio che sono basati principalmente su un semplice abbinamento di schemi e non su metodi linguistici.
7. La linguistica e CALL
I progressi in TAL e CALL sono stati resi possibili soprattutto grazie alla nostra comprensione migliore delle strutture della lingua. La mancanza di modelli linguistici adeguati e l'insufficiente capacità delle tecniche di elaborazione del linguaggio naturale sono state considerate talvolta la causa della mancanza di progressi in alcuni settori di CALL (si veda per esempio Levy 1997:3, che cita Kohn). Gli esempi della sezione precedente hanno dimostrato che è possibile applicare certe teorie linguistiche (per esempio la fonologia e la morfologia) alle Tecnologie per le lingue umane e attuare questa tecnologia nel software CALL. Tuttavia, chi è contrario ad un approccio basato sugli analizzatori sintattici all'interno di CALL sostiene che "l'architettura dell'Intelligenza Artificiale( AI) è ancora lontana dalla creazione di qualcosa che rifletta il sistema complesso della comunicazione insito in tutte le lingue umane e non è dunque in grado di contribuire a fare passi in avanti qualitativi nella progettazione dei programmi CALL" (Salaberry 1996:11). Salaberry sostiene questa sua affermazione aggiungendo che "la ragione più importante di questo fallimento [di ICALL] è che i programmi NPL (Elaborazione del Linguaggio Naturale) - che sottostanno allo sviluppo di ICALL - non spiegano appieno la complessità dei linguaggi umani naturali" (1996:12). Naturalmente è vero.
Tuttavia non significa che frammenti o aspetti interessanti di una data lingua non possano essere analizzati da una teoria linguistica formale e di qui attuati in un'applicazione CALL. In altre parole, se non si può descrivere la lingua tedesca nella sua interezza, ciò non significa che non si possano catturare interessanti fenomeni linguistici di quella lingua. Per esempio, la struttura delle parole tedesche, la loro morfologia, può essere descritta in modo che il computer "capisca" e questa conoscenza si dimostra una solida base per varie applicazioni CALL (identificazione di diverse desinenze grammaticali, pratica della flessione delle parole tedesche in contesto, correttori di documenti).
Ciò significa che se siamo in grado soltanto di descrivere adeguatamente un frammento di una lingua data, possiamo pur sempre fare buon uso di questa descrizione nelle applicazioni informatiche per l'apprendimento linguistico. Ed è molto importante, perché sempre ci troveremo nelle condizioni di non poter descrivere completamente una lingua viva. E come potremmo: la lingua viene costantemente modificata nella comunicazione, la adattiamo ai bisogni in continuo sviluppo e pertanto mutevoli. Così dobbiamo fare tesoro delle nostre conoscenze di certi aspetti o frammenti di lingua.
Che tipo di conoscenze dovremmo avere sulla lingua prima di potere tentare di produrre uno strumento TAL che possa essere efficace all'interno di CALL? Prendiamo in considerazione un aspetto particolare della lingua - la grammatica. Negli