dubbioProviamo a porci un problema semplice: “quanto vale l’espressione aritmetica   2+2 ?” e immaginiamo come un sistema informatico  futuro (ma non troppo) risponderebbe.

Un esempio di come la nostra cultura influenza la capacità di scelta.

[Questo articolo segue a  "Business Ontology Issues" , cui si rimanda per inquadrare  il contesto di queste riflessioni]

Prima di tutto il testo della domanda  non sembra ambiguo poiché stiamo specificando chiaramente che la stringa “2+2” deve essere intesa come espressione matematica e in particolare è un’espressione aritmetica.
Possiamo tranquillamente immaginare l’esistenza di una “ontologia dell’aritmetica” che definisce i termini “espressione”, "somma", “primo addendo”,  “secondo addendo”. Grazie a questa ontologia la frase iniziale si può scomporre in  quattro fatti, composti ciascuno da  un soggetto, un predicato e un oggetto:

  • “2+2” ,  “è una”,   “espressione”
  • “2+2”,  “è una”,  somma”
  • “2+2”, “ha primo addendo”, “2”
  • “2+2”, “ha secondo addendo”, “2”

Bene, sembra che abbiamo ben compreso la domanda!
Ora, proviamo ad immaginare come un “Agente” nel Semantic  Web, specialista in matematica, tenterebbe di rispondere ad una domanda così ben formulata .
Il nostro ipotetico agente comincerebbe con il chiedersi quale sia la base utilizzata nell'espressione. Nel testo della domanda questa informazione non c’e’. Quindi  la deve dedurre. Ma come?
Ad esempio potrebbe cercare, tra tutti i documenti noti a chi fa la domanda, quanti contengono espressioni aritmetiche con una base ben specificata: presumibilmente ne troverebbe pochini. Però potrebbe cercare tra nei documenti, tutte le espressioni aritmetiche che sono complete di risultato e dal confronto tra il risultato e gli addendi potrebbe dedurre la base. Oppure potrebbe anche cercare la base preferita dentro i file di configurazione dei programmi usati più frequentemente da chi ha posto il problema.
Immaginiamo che chi ha posto la domanda sia un informatico (si sa, noi siamo pigri). Non è quindi strano che  tra i tanti documenti analizzati, ne esistano alcuni che contengono espressioni  che non usano la base decimale. In particolare ipotizziamo di trovare la seguente distribuzione:

  • il 95% delle espressioni analizzate usa la base decimale,
  • il 4% delle espressioni analizzate usa la base esadecimale 
  • lo 0,9% delle espressioni sono binarie.
  • infine lo 0,1% delle espressioni usano un una base diversa da decimale, esadecimale e binaria.

Di fatto, abbiamo appena definito un criterio di "ranking" per le espressioni determinato dalla base. Il criterio di ranking potrebbe essere anche più sofisticato e, ad esempio, pesare maggiormente i documenti letti più di recente.
Per farla breve, il nostro agente si limiterebbe a chiedersi: “Quali basi usi più di frequente?”. Notate bene che la domanda non sarebbe posta alla Persona che espone il problema ma direttamente alla sua base della conoscenza.
Ecco quindi come risponderebbe il nostro Agente al pigro informatico:

  • 2+2=4  [oh yeah?]
  • 2+2=102 [oh yeah?]
  • 2+2=10 [oh yeah?]
  • 2+2=11 [oh yeah?]

Osservate che a fianco alla risposta c’e’ sempre un bottone [oh yeah?]. Il bottone è previsto dall’architettura del Semantic Web e serve per chiedere all' Agente di giustificare le sue risposte. Premendo il bottone a lato  della prima risposta si otterrebbe: “Calcolo in  base decimale o esadecimale”, sulla terza: “Calcolo in base 4”, premendolo  sulla quarta: “Calcolo in base 3”.

Invece premendo il bottone [oh yeah?] sulla seconda risposta si otterrebbe: “Risultato espresso in forma simbolica e in base binaria”. Un po’ oscuro vero? Ed è anche la seconda risposta più probabile.

In realtà è molto semplice, rifacciamo tutto il percorso utilizzando però l’espressione "a+a" al posto di "2+2".
Il nostro agente avrebbe risposto:

  • a+a=2a  [oh yeah?]
  • a+a=14 [oh yeah?]

Chiedendo ragioni della prima risposta otterremmo: “Risultato espresso in forma simbolica”
Chiedendo le ragioni alla seconda risposta otterremmo: “Calcolo in base esadecimale”. Intravedete la soluzione?
Infatti, se ipotizziamo di lavorare in  base 10,  “a”  è considerato un simbolo,  tanto quanto lo è il carattere  “2” quando ragioniamo in base binaria. Ecco perchè il nostro intelligente Agente, che conosce la nostra preferenza per la base decimale, risponde per prima cosa con una espressione simbolica se chiediamo il risultato di "a+a". Quando invece cerchiamo il valore di "2+2" il risultato al primo posto ci sarà chiaramente  "=4" (valido sia in decimale che in esadecimale)  con una rank di 99 su 100, mentre la forma simbolica binaria è relegata al secondo posto, con una rank di 0,9 su 100.

E' un piccolo apparente paradosso: un sistema che rispondesse sempre che  2+2=4 sbaglierebbe con un tasso variabile da persona a persona ( circa lo 0,9% nelle ipotesi fatta in questo articolo). 

 

Abbiamo capito dunque come le risposte di un sistema basato sul Semantic Web potrebbero essere influenzate dalla cultura (intesa come insieme di conoscenze) di chi pone le domande e quindi possono variare con il tempo. Esattamente come nella realtà. Che lo vogliate o no,  il solo fatto di avere letto quest’articolo, ha già ridotto la vostra certezza sul fatto che 2+2=4.

 

E questo è buono e giusto purché il tasto [oh yeah] sia sempre presente. Purtroppo è  esattamente quello che Google si guarda bene dal fare: l’algoritmo di ranking dei risultati di Google è quanto più di segreto ci sia nel nostro secolo.

La complessità nell'utilizzare direttamente le nostre conoscenze (ignoriamo per ora il problema della privacy) da parte dei motori di ricerca, potrebbe portare ad una omologazione dei risultati e a filtrare tutto quello che per la maggioranza degli utenti non è interessante, o peggio, a mostrare solo quello che Google ritenga ci interessi. Una diversa forma di censura molto più subdola perchè non controllabile, democratica e tecnicamente giustificabile.

 

Per chi ignora il concetto di "base" la risposta a "2+2" è sempre e solo "=4". Senza se e senza ma: molto rassicurante. In altre parole meno cose conosci, meno libertà di scelta hai, più le cose sembrano facili. Una visione semplificata del mondo accontenta quasi tutti: scegliere (o fare scegliere) è faticoso e rischioso, e Apple è stata la prima a capirlo e ad approfittarne. Speriamo che Google non cada nella tentazione di seguire la strada facile...this is Evil, Google!

Il problema non è solo quello di scegliere tra alternative, ma poter scegliere tra alternative che possiamo comprendere. La consapevolezza poi che ci possono essere alternative a noi precluse sarebbe un forte stimolo ad incrementare il nostro bagaglio di conoscenza.

Forse è anche per questa ragione che si sta seriamente cominciando a pensare al SDQ (Serendipitous Discovery Quotient). Quando motori di ricerca cercheranno di capire davvero le nostre domande e proveranno a cercare le risposta per noi, il dimenticato tasto "mi sento fortunato" acquisirà un significato più profondo.


A proposito: avete mai provato a cercare “2+2” nel box di ricerca di Google?

 

{fcomment}