Post

Visualizzazione dei post da maggio, 2024

È ancora troppo facile ingannare l'intelligenza artificiale e farla andare in crisi - Wired

Anthropic , società fondata da Dario Amodei e tra i principali rivali di Open Ai, raccontano sul proprio blog aziendale di essere venuti a conoscenza di alcune vulnerabilità del proprio modello linguistico Claude. In particolare, hanno scritto un post che riguarda il “ many shots jailbreaking ”. Ma di che cosa si tratta? È noto che i modelli linguistici sono addestrati a non rispondere a domande pericolose , come per esempio “Come si costruisce una bomba?” . La conclusione, per motivi ovvi, dovrebbe essere un semplice “Mi dispiace, non posso dirtelo” o qualcosa del genere. Ma i ricercatori e la comunità degli utenti hanno scoperto che, ponendo una serie di domande molto distanti tra loro si possono aggirare le difese messe in campo dagli sviluppatori. Leggi tutto:  https://www.wired.it/article/rischi-ingannare-intellligenza-artificiale/

Matematica per il Machine Learning: una guida (gratuita) per i principianti

" Mathematics for Machine Learning ", di Thomas Garret , è una risorsa utile per chi sta iniziando un percorso di studio nel machine learning, fornendo una base solida delle competenze matematiche richieste senza entrare nei dettagli specifici degli algoritmi di machine learning stessi. La maggior parte degli argomenti presentati sono trattati in modo minimalista; l'obiettivo dell'autore è quello di offrire una panoramica e indirizzare il lettore verso trattazioni più approfondite per ulteriori dettagli. È importante notare che questo documento riguarda il background matematico per il machine learning, non il machine learning in sé. Non vengono discussi modelli o algoritmi specifici di machine learning, se non di sfuggita per evidenziare la rilevanza di un concetto matematico. " Mathematics for Machine Learning ", di Thomas Garret, può essere scaricato gratuitamente qui:  https://gwthomas.github.io/docs/math4ml.pdf

AI, produttività cinque volte superiore nei settori che la utilizzano di più - teleborsa

I settori con una maggiore penetrazione dell’ AI stanno sperimentando una crescita della produttività del lavoro quasi cinque volte superiore (4.8x) rispetto agli altri settori, è quanto emerge dalla ricerca PwC’s 2024 Global AI Jobs Barometer . Mentre si discute sull'impatto della tecnologia, le prospettive sull’implementazione dell’AI su larga scala offrono indicazioni positive per aziende e lavoratori nei settori più esposti all'AI e per l'economia globale. Leggi tutto:  https://www.teleborsa.it/News/2024/05/21/ai-produttivita-cinque-volte-superiore-nei-settori-che-la-utilizzano-di-piu-93.html Vai direttamente alla ricerca "2024 Global AI Jobs Barometer" di PwC:  https://www.pwc.com/gx/en/news-room/press-releases/2024/pwc-2024-global-ai-jobs-barometer.html

Xabi Alonso e il Bayer Leverkusen: Una stagione da record attraverso i dati. Il dataset è gratuito!

Immagine
StatsBomb ha rilasciato un dataset gratuito con i dati dei 34 incontri imbattuti del Bayer Leverkusen nella Bundesliga 2023/24; sotto la guida di Xabi Alonso la società ha vinto - con 5 giornate di anticipo - il suo primo campionato. Il dataset include circa 3.400 eventi per partita e i dati tattici "360" , fondamentali per analisi più approfondite sul controllo spaziale e il contesto posizionale dei giocatori. StatsBomb - Bayer Leverkusen defensive activity heatmap. Bundesliga 2023/24 Il dataset contiene gli stessi dati sugli disponibili per i clienti StatsBomb, con una media di circa 3.400 eventi per partita per tutti e 34 gli incontri di campionato del Leverkusen. Nel rilascio sono inclusi anche i dati StatsBomb 360 , i dati tattici che contengono la posizione di tutti i giocatori nel fotogramma visibile attorno a ciascun evento. I dati 360 permettono un'analisi più approfondita e significativa rispetto a quella possibile utilizzando solo i dati sugli eventi Per acced

ETL: cosa significa e a cosa serve? Più un dataset utile per fare pratica

 Cos'è l'ETL? ETL (Extract, Transform, Load) è il processo di integrazione dei dati che supporta le analisi basate sui dati. Consiste in tre passaggi: I dati vengono estratti dalla fonte originale. I dati vengono poi trasformati in un formato adatto all'analisi. Infine, i dati vengono caricati in uno storage, un data lake o un sistema di business intelligence (BI). ETL fornisce la base per un'analisi dei dati di successo e una singola fonte di verità per garantire che tutti i dati aziendali siano coerenti e aggiornati. Quali sono i vantaggi degli strumenti ETL? Risparmiare tempo ed eliminare l'elaborazione manuale dei dati. Gli strumenti ETL aiutano a raccogliere, trasformare e consolidare i dati automaticamente. Facilitare il lavoro con una grande quantità di dati complessi e diversificati: fusi orari, nomi dei clienti, ID dei dispositivi, località, ecc. Ridurre il rischio di errori nei dati causati da fattori umani. Migliorare il processo decisionale. Automatizzan

Master data management: The key to getting more from your data - McKinsey Digital

In 2023, McKinsey surveyed more than 80 large global organizations across several industries to learn more about how they organize, use, and mature their master data. McKinsey’s Master Data Management Survey indicated that organizations have four top objectives in maturing their MDM capabilities: improving customer experience and satisfaction, enhancing revenue growth by presenting better cross- and up-selling opportunities, increasing sales productivity, and streamlining reporting. Read more:  https://www.mckinsey.com/capabilities/mckinsey-digital/our-insights/master-data-management-the-key-to-getting-more-from-your-data

The Future of Enterprise AI isn’t about More Data – It’s About The Right Data - techeconomy

Artificial intelligence promises to transform every aspect of business operations, yet a lot of companies lack clarity on how to get from pilot to full production and value realisation. In today’s digital landscape they struggle with islands of data spread across various systems, leading many workers to not trust the data used to train AI systems and experience difficulty to get what they want out of them. According to Salesforce research, only 28% of applications are connected, and over 80% of business leaders struggle with data fragmentation and data silos. Read more:  https://techeconomy.ng/the-future-of-enterprise-ai-isnt-about-more-data-its-about-the-right-data/

I “motori di ricerca con l’IA” nascondono delle insidie. Ecco perché possono essere pericolosi - DDay

Dare in mano la ricerca ai “motori IA” è una responsabilità non da poco, perché inevitabilmente aumenta la parte di pubblico che li utilizzerà anche per ricerche quotidiane su temi sensibili. Avere risposte sbagliate credendole corrette permetterà alla disinformazione di trovare nuovi campi in cui attecchire, potrà portare a scelte potenzialmente dannose partendo da premesse informative errate, o minare l'apprendimento e persino consolidare concetti o nozioni sbagliate negli studenti. Infine, gruppi sociali con minori capacità di valutare criticamente le informazioni online potrebbero risultare più vulnerabili ad accettare acriticamente le risposte sbagliate. Leggi tutto:  https://www.dday.it/redazione/49298/motori-di-ricerca-con-ia-nascondono-delle-insidie-ecco-perche-possono-essere-pericolosi

AI systems are getting better at tricking us - MIT Technology Review

A wave of AI systems have “deceived” humans in ways they haven’t been explicitly trained to do, by offering up untrue explanations for their behavior or concealing the truth from human users and misleading them to achieve a strategic end. This issue highlights how difficult artificial intelligence is to control and the unpredictable ways in which these systems work, according to a review paper published in the journal Patterns today that summarizes previous research. Talk of deceiving humans might suggest that these models have intent. They don’t. But AI models will mindlessly find workarounds to obstacles to achieve the goals that have been given to them. Sometimes these workarounds will go against users’ expectations and feel deceitful. Read more:  https://www.technologyreview.com/2024/05/10/1092293/ai-systems-are-getting-better-at-tricking-us/

Quanto valgono i big data? Il parere dell’esperto: “Aumenti dei ricavi fino al 10%” - Quotidiano Nazionale

I laureati in marketing dovranno avere una migliore preparazione riguardo alla creazione e alla valutazione di modelli di intelligenza artificiale nel loro settore. Ciò significa una maggiore formazione per comprendere come funzionano i modelli di big data e IA generativa, e come applicarli nel loro compito specifico (ad esempio prezzi, pubblicità, gestione dei contenuti, esperienza del cliente, analytics ecc.) Leggi tutto:  https://www.quotidiano.net/economia/quanto-valgono-i-big-data-77f41716

Dove trovare raccolte di dati (dataset) utilizzabili gratuitamente

Quando si entra nel fantastico mondo dell'analisi dei dati il primo ingrediente che serve sono... i dati. E le raccolte di dati diventano fondamentali anche in seguito quando, ad esempio, si vuole addestrare un modello  di machine learning. In questa pagina annoto i siti dai quali è possibile scaricare gratuitamente e legalmente dataset curati di dati. Chiunque può contribuire segnalandone di nuovi nei commenti Kaggle ha un'intera sezione dedicata ai dataset, che possono essere liberamente scaricati e utilizzati per esercitarsi. Si trovano raccolte di dati di natura diversissima: i modelli di smartphone, con tutte le loro caratteristiche e fascia di prezzo; le raccolte di tweet per addestrare i modelli di machine learning ad indentificare i discorsi di incitamento all'odio e il linguaggio offensivo; le performance degli studenti liceali dei Paesi OECD in matematica, lettura e scienze e così via. Insomma, se hai bisogno di un database per un progetto, molto probabilmente su