Company name: Dynamic Solutions s.r.l.
Address: VIA USODIMARE 3 - 37138 - VERONA (VR) - Italy

E-Mail: [email protected]

Scandalo Nvidia: video YouTube e Netflix usati per addestrare IA

Nvidia sotto accusa per aver utilizzato contenuti protetti per addestrare i suoi algoritmi di intelligenza artificiale, violando i termini di servizio delle piattaforme.
  • Nvidia ha scaricato 38,5 milioni di video da YouTube e Netflix per addestrare il suo modello IA.
  • L'azienda ha utilizzato downloader video open-source come yt-dlp e macchine virtuali con indirizzi IP a rotazione per evitare blocchi.
  • Le azioni di Nvidia sono scese del 4% nel trading pre-market in seguito all'indagine antitrust del Dipartimento di Giustizia degli Stati Uniti.

Il gigante dei chip Nvidia è al centro di una tempesta mediatica e legale negli Stati Uniti. Secondo un’inchiesta di Engadget, l’azienda avrebbe utilizzato contenuti protetti da copyright provenienti da piattaforme come YouTube e Netflix per addestrare i suoi algoritmi di intelligenza artificiale. Questa pratica, nota come scraping, consiste nel raccogliere dati da fonti online senza autorizzazione, e potrebbe rappresentare una violazione dei termini di servizio delle piattaforme coinvolte.

Nvidia ha difeso le sue azioni affermando che, secondo la legge sul copyright, sono protette solo le espressioni specifiche di idee e concetti, non i fatti e le informazioni generali. Di conseguenza, la sua IA potrebbe esercitarsi con contenuti online per crearne di nuovi. Tuttavia, YouTube ha replicato che questa pratica costituisce una violazione dei termini di servizio della piattaforma. La raccolta di contenuti video, come l’archivio di 130 milioni di video destinato a scopi accademici, è stata considerata un abuso.

Oltre ai video di YouTube e Netflix, Nvidia avrebbe incaricato i suoi collaboratori di scaricare altri materiali, tra cui trailer di film da MovieNet, filmati di videogiochi e archivi di dati da Github, WebVid e InternVid-10M.

80 anni di video scaricati ogni giorno

Un’inchiesta di 404 Media ha rivelato che Nvidia ha utilizzato pratiche di data scraping per addestrare il suo modello di intelligenza artificiale video “Cosmos”. Documenti interni e chat su Slack mostrano che l’azienda ha chiesto ai dipendenti di ottenere video da Netflix, YouTube e altre fonti per addestrare il modello IA, destinato a diventare parte fondante di prodotti commerciali come il generatore di mondi 3D Omniverse, sistemi di auto a guida autonoma e prodotti “digital human”.

I dipendenti sono stati istruiti a utilizzare downloader video open-source come yt-dlp e macchine virtuali con indirizzi IP a rotazione per evitare di essere bloccati da YouTube. A marzo, il progetto ha raggiunto il record di 100.000 video scaricati in due settimane, e alla fine di maggio, il numero totale di video ottenuti era di 38,5 milioni. Il dataset HD-VG-130M, creato dall’Università di Pechino e composto da 130 milioni di video YouTube, è stato utilizzato per scopi di ricerca accademica, ma Nvidia lo ha impiegato per finalità commerciali, violando così le condizioni d’uso del dataset.

Google ha ricordato che l’utilizzo di video di YouTube per l’addestramento di modelli IA, come avvenuto con OpenAI per Sora, costituisce una “chiara violazione” dei termini di utilizzo della piattaforma. Anche Netflix ha dichiarato di non avere alcun accordo con Nvidia per l’uso dei suoi contenuti e che i termini di servizio della piattaforma non consentono lo scraping.

Cosa ne pensi?
  • ✊ Grande innovazione da Nvidia, ma......
  • 🚫 Pratica inaccettabile di Nvidia che......
  • 🔍 Vista da un'altra prospettiva, la situazione Nvidia potrebbe......

Nvidia: scandalo per scraping video non autorizzato

Il caso Nvidia solleva interrogativi sulle pratiche di addestramento dell’intelligenza artificiale. Secondo l’inchiesta di 404 Media, Nvidia, un colosso tecnologico da 2,4 trilioni di dollari, ha chiesto ai dipendenti di scaricare video da YouTube e Netflix per sviluppare progetti commerciali di IA. L’obiettivo era addestrare modelli per prodotti come il generatore di mondi 3D Omniverse, sistemi di auto a guida autonoma e iniziative legate agli “esseri umani digitali”.

Nvidia ha difeso le sue pratiche affermando di agire “nel rispetto dello spirito delle leggi sul copyright”, sottolineando che le leggi sulla proprietà intellettuale proteggono espressioni specifiche, non fatti, idee, dati o informazioni. Tuttavia, YouTube non condivide questa interpretazione e ha ribadito che l’utilizzo dei suoi contenuti per addestrare modelli IA costituisce una “chiara violazione” dei termini di servizio della piattaforma.

I dipendenti di Nvidia hanno sollevato preoccupazioni etiche e legali, ma i manager hanno risposto che la decisione era stata approvata ai massimi livelli aziendali. Per evitare di essere bloccati da YouTube, Nvidia ha utilizzato macchine virtuali con indirizzi IP a rotazione. L’azienda ha fatto uso di dataset come MovieNet, WebVid e InternVid-10M, alcuni dei quali destinati solo a scopi accademici e non commerciali. Queste pratiche sollevano interrogativi sulle modalità di addestramento dei modelli IA e sul rispetto dei diritti d’autore.

Crollo delle azioni Nvidia nel pre-market a causa dell’antitrust

Le azioni di Nvidia Corp. (NASDAQ: NVDA) sono scese del 4% nel trading pre-market venerdì, a seguito dei report su un’indagine antitrust del Dipartimento di Giustizia degli Stati Uniti sulle accuse di pratiche monopolistiche nel mercato dei chip IA. L’indagine, avviata in risposta alle lamentele dei concorrenti, si concentra sul potenziale abuso di posizione dominante di Nvidia nel mercato dei chip IA, che detiene l’80% del mercato.

L’indagine esamina se Nvidia abbia esercitato pressioni sui cloud provider affinché acquistassero più prodotti Nvidia e se abbia fatto pagare prezzi elevati per le apparecchiature di rete, scoraggiando l’acquisto di chip IA dei rivali Advanced Micro Devices (NASDAQ: AMD) e Intel Corp. (NASDAQ: INTC). Un portavoce di Nvidia ha dichiarato a Reuters che l’azienda compete grazie a decenni di investimenti e innovazione, rispettando le leggi e garantendo ai clienti la possibilità di scegliere la soluzione migliore.

Gruppi progressisti e la senatrice Elizabeth Warren (D-Mass.) hanno chiesto al DOJ di indagare su Nvidia per problemi di concorrenza. L’indagine fa parte di una più ampia attenzione normativa sul settore dell’IA. A giugno, il Dipartimento di Giustizia degli Stati Uniti e la Federal Trade Commission hanno finalizzato un accordo per facilitare potenziali indagini antitrust sulla posizione dominante dei leader del settore dell’IA, tra cui Microsoft Corp. (NASDAQ: MSFT), OpenAI e Nvidia.

Nonostante i controlli statunitensi sulle esportazioni, Nvidia prevede di generare 12 miliardi di dollari in Cina dalla vendita di chip IA, sottolineando le manovre strategiche dell’azienda per mantenere la sua presenza sul mercato globale. Giovedì, il titolo Nvidia ha chiuso a 109,21 dollari, con un calo del 6,67%. Nelle contrattazioni pre-market, il titolo ha continuato la tendenza al ribasso, scendendo del 3,53%. Tuttavia, il titolo Nvidia ha registrato una crescita significativa, con un aumento del 126,72%, secondo i dati di Benzinga Pro.

Bullet Executive Summary

La vicenda Nvidia mette in luce le complesse dinamiche legate all’addestramento dei modelli di intelligenza artificiale e al rispetto dei diritti d’autore. La pratica di scraping di video da piattaforme come YouTube e Netflix solleva interrogativi etici e legali, mentre l’indagine antitrust del Dipartimento di Giustizia degli Stati Uniti evidenzia le preoccupazioni sulla posizione dominante di Nvidia nel mercato dei chip IA.

In un contesto in cui l’intelligenza artificiale sta diventando sempre più centrale nelle nostre vite, è fondamentale riflettere su come le aziende tecnologiche gestiscono i dati e rispettano i diritti dei creatori di contenuti. La nozione di fair use e il rispetto delle leggi sul copyright sono temi cruciali che richiedono una regolamentazione più chiara e trasparente.

Una nozione base di intelligenza artificiale correlata al tema principale dell’articolo è il concetto di apprendimento supervisionato, dove un modello IA viene addestrato utilizzando un dataset etichettato per imparare a fare previsioni o classificazioni. In questo caso, Nvidia ha utilizzato video etichettati per addestrare i suoi modelli IA.

Una nozione avanzata di intelligenza artificiale applicabile al tema dell’articolo è il transfer learning, una tecnica che permette a un modello IA di trasferire conoscenze acquisite da un compito a un altro. Questo è particolarmente rilevante per Nvidia, che potrebbe utilizzare i dati raccolti per migliorare vari prodotti commerciali, dai mondi 3D agli esseri umani digitali.

In conclusione, la vicenda Nvidia ci invita a riflettere sulle implicazioni etiche e legali dell’addestramento dei modelli di intelligenza artificiale, sottolineando l’importanza di una regolamentazione più rigorosa e trasparente per proteggere i diritti dei creatori di contenuti e garantire un uso responsabile dei dati.


Articolo e immagini generati dall’AI, senza interventi da parte dell’essere umano. Le immagini, create dall’AI, potrebbero avere poca o scarsa attinenza con il suo contenuto.(scopri di più)
0 0 votes
Article Rating
Subscribe
Notificami
guest
3 Commenti
Oldest
Newest Most Voted
Inline Feedbacks
View all comments
3
0
Ci interessa la tua opinione, lascia un commento!x