
I dati tabulari sono un termine ampio che comprende dati strutturati che generalmente si adattano a una specifica riga e colonna. Possono essere un database SQL, un foglio di calcolo, un file .CSV, ecc.
Nonostante ci sia stato un enorme progresso nell'applicazione dell'intelligenza artificiale ai dati non strutturati e sequenziali, questi grandi modelli di linguaggio sono per loro natura sfumati. Sono progettati per manipolare i token di input per generare un output coerente senza necessariamente seguire una struttura fissa. I migliori LLM sono anche costosi da accedere tramite un'API o da eseguire sulla propria infrastruttura cloud.
Eppure, molte aziende hanno già una strategia sui dati con un data warehouse o un data lake per centralizzare tutti i dati importanti e alcuni data scientist che possono sfruttare questi dati per migliorare la strategia dell'azienda.
La startup francese Neuralk-AI è un'azienda di intelligenza artificiale che si è concentrata su modelli di intelligenza artificiale basati su dati tabulari. L'azienda ha annunciato questa settimana un finanziamento di $4 milioni.
“I dati con un vero valore per le aziende sono dati che sono stati identificati molto tempo fa, strutturati sotto forma di tabella e utilizzati dai data scientist di queste aziende per creare tutti i loro algoritmi di machine learning,” ha detto Alexandre Pasquiou, cofondatore e Chief Scientist Officer di Neuralk-AI, a TechCrunch.
Neuralk-AI ritiene che ci sia un'opportunità nel rivedere lo sviluppo dei modelli di intelligenza artificiale, ma con un focus specifico sui dati strutturati. Inizialmente, prevede di offrire il suo modello come API ai data scientist che lavorano per le aziende di commercio perché queste aziende amano i dati - pensate a cataloghi di prodotti, database clienti, trend del carrello della spesa, ecc.
“Oggi, i LLM sono ottimi per la ricerca, l'interazione naturale degli utenti e per rispondere a domande basate su documenti non strutturati. Ma ha alcune limitazioni nel momento in cui torniamo al machine learning classico, che si basa davvero sui dati tabulari classici,” ha detto Pasquiou.
Con Neuralk-AI, i rivenditori possono automatizzare flussi di lavoro dati complessi con deduplicazione e arricchimento intelligenti. Ma potrebbero anche utilizzare i modelli dell'azienda per rilevare frodi, ottimizzare le raccomandazioni di prodotti e generare previsioni di vendita che potrebbero essere utilizzate per la gestione dell'inventario e la definizione dei prezzi dei prodotti.
Fly Ventures ha guidato il round da $4 milioni dell'azienda con la partecipazione anche di SteamAI. Diversi business angel hanno anche investito nella startup, come Thomas Wolf di Hugging Face, Charles Gorintin di Alan e Philippe Corrot e Nagi Letaifa di Mirakl.
Il team sta ancora lavorando attivamente sui suoi modelli. Prevede di testare con un gruppo di importanti rivenditori francesi e startup del commercio, come E.Leclerc, Auchan, Mirakl e Lucky Cart.
“Entro tre o quattro mesi, rilasceremo la prima versione del nostro modello e il benchmark pubblico su cui saremo in grado di classificare il nostro modello rispetto allo stato dell'arte in questo settore,” ha detto Pasquiou. “E a settembre, l'idea è essere il miglior modello di base tabellare in tutto ciò che riguarda l'apprendimento della rappresentazione.”