LinkedIn

Di cosa parliamo quando parliamo di Intelligenza Artificiale?

L'intelligenza artificiale sta diventando una parte importante della nostra vita è importante che tutti abbiano una comprensione di base per comprendere come funziona e quali potrebbero essere le sue implicazioni.

Di cosa parliamo quando parliamo di Intelligenza Artificiale?
“a robot-looking dog dressed as a librarian, digital art” Adriano × DALL·E Human & AI

L'intelligenza artificiale sta rapidamente diventando una parte importante della nostra vita quotidiana e delle nostre economie, è importante che tutti, non solo gli esperti di IA, abbiano una comprensione di base di cosa sia l'intelligenza artificiale, per comprendere come funziona e immaginare quali potrebbero essere le sue implicazioni per la società.

Cos'è l'intelligenza artificiale (IA)

Tendenzialmente si definisce Intelligenza Artificiale la disciplina che si occupa di creare sistemi capaci di compiere compiti cognitivi che richiedono intelligenza umana, come il ragionamento, il riconoscimento del linguaggio, l'apprendimento e la percezione.

In generale IA include i sistemi che utilizzano algoritmi di apprendimento automatico, detti anche di Machine Learning, che sono in grado di apprendere dai dati, per costruire modelli matematici utilizzati per fare previsioni su nuovi dati o per prendere decisioni.

Una sottocategoria dell'apprendimento automatico e il Deep Learning,  che utilizza reti neurali complesse per analizzare e riconoscere i dati.

Lollixzc, CC BY-SA 4.0, via Wikimedia Commons

Tipologie di apprendimento automatico

Ci sono diverse tipologie di algoritmi di Machine Learning, tra cui:

  • Apprendimento supervisionato: in questo tipo di algoritmo, i dati sono etichettati e utilizzati per "insegnare" al modello come fare una previsione o prendere una decisione. Ad esempio, un algoritmo di apprendimento supervisionato può essere utilizzato per costruire un modello che riconosce le immagini di gatti e cani, utilizzando un set di immagini etichettate come "gatti" e "cani".
  • Apprendimento non supervisionato: in questo tipo di algoritmo, i dati non sono etichettati e il modello deve trovare la struttura o le relazioni nei dati da solo. Ad esempio, un algoritmo di apprendimento non supervisionato può essere utilizzato per raggruppare clienti in base alle loro caratteristiche o per ridurre la dimensione di un dataset.
  • Apprendimento per rinforzo: in questo tipo di algoritmo, il modello interagisce con un ambiente e riceve un segnale di feedback sotto forma di un premio o di una penalità. Il modello utilizza queste informazioni per migliorare le sue decisioni. Ad esempio, un algoritmo di apprendimento rinforzato può essere utilizzato per addestrare un robot a camminare o un agente a giocare a un gioco.

Deep Learning e reti neurali

Le reti neurali sono un tipo di modello che si ispira al funzionamento del cervello umano. Rientrano nella sottocategoria AI Deep Learning ed in sintesi consistono in un insieme di neuroni artificiali che sono connessi tra loro e lavorano insieme per riconoscere modelli, simulare relazioni e prendere decisioni.

Neural network with one layer, reference image create by Chrislb - Public Domain, https://commons.wikimedia.org/w/index.php?curid=39564293

La rete neurale Transformer

Un'esempio di rete neurale é Transformer: un tipo di algoritmo di apprendimento automatico basato su una architettura di Rete Neurale Artificiale (RNA) che è stata sviluppata per il processamento del linguaggio naturale (NLP).

È stata presentata nel 2017 in un articolo scientifico intitolato "Attention Is All You Need" (L'attenzione è tutto ciò di cui hai bisogno).

Attention is all you need: Discovering the Transformer paper
Detailed implementation of a Transformer model in Tensorflow

La principale caratteristica della Transformer è l'utilizzo dell'attenzione, un meccanismo che permette alla rete neurale di concentrarsi su parti specifiche del testo durante il processo di generazione del linguaggio.

Questo rende la Transformer particolarmente efficace per compiti come la traduzione automatica, la sintesi del testo e la generazione di testo.

L'Intelligenza Artificiale Generativa

L'IA generativa si concentra sulla generazione di nuovi dati, come immagini, testo, suoni e video, invece di semplicemente riconoscerli o classificarli.

Foto di Possessed Photography su Unsplash

I modelli generativi più comuni utilizzati sono:

  • Generative Adversarial Networks (GAN): utilizzano un meccanismo di apprendimento basato su due reti neurali, una generatrice e un discriminatore, che lavorano insieme per generare nuovi dati simili a quelli del dataset di addestramento.
  • Generative Pre-trained Transformer (GPT): utilizzano un'architettura di trasformazione generativa pre-addestrata, che consiste in una serie di strati di attenzione (Transformer) per imparare a generare testo in modo plausibile.

ChatGPT la rockstar dell'AI

ChatGPT è un modello generativo basato sull'architettura del GPT,  utilizza una tecnica chiamata "pre-training", in cui viene addestrato su un grande quantita di testo prima di essere del "fine-tuning" per un compito specifico. Durante il pre-addestramento, il modello impara a comprendere il linguaggio naturale e a riconoscere schemi e relazioni tra le parole.

Una volta pre-addestrato, il modello può essere fine-tunato su un dataset specifico per un compito specifico, come la generazione di risposte alle domande. Durante questo processo, i pesi del modello vengono regolati per adattarsi al nuovo compito.

Il modello utilizza una rete neurale Transformer e la tecnica dell'attenzione, che gli permette di prestare attenzione solo alle parti dell'input che sono rilevanti per generare una risposta.

Quindi  Chat-G-P-T sta per:

  • Chat: Perché lo scopo è di creare un'AI che sia in grado di dialogare in modo naturale
  • G: Generative perchè rientra nelle intelligenze artificiali generativa
  • P: Pre-Trained perché untilizza la tecnica del pre-training e fine-tuning successivo
  • T: Transformer perché utilizza reti neurali Transformer per prestare attenzione solo agli elementi rilevanti

In pratica per generare una risposta, ChatGPT utilizza quello che ha imparato durante il pre-addestramento e fine-tuning per analizzare l'input dell'utente in linguaggio naturale e generare una risposta tramite la sua capacitá di prestare attenzione solo agli elementi importanti della domanda e la capacitá di generare testo in modo plausibile.

📣
Le opinioni espresse sono personali e non riflettono necessariamente le posizioni o le politiche dell'azienda o dell'ente per cui lavoro. Si prega di fare la propria valutazione critica del contenuto e di non considerare le informazioni fornite come consiglio professionale.
🤖
Il contenuto di questo post è stato generato con l'aiuto dell'intelligenza artificiale di OpenAI's GPT-3. Si prega di notare che le informazioni fornite possono non essere complete o accurate. Si raccomanda di fare ulteriori ricerche prima di prendere decisioni importanti basate sul contenuto di questo post

Discussione