Бюлетин за данни и AI: Април 2023
Добре дошли в нашия априлски бюлетин за данни и изкуствен интелект!
В това издание сме подготвили редица новини и идеи, които да ви държат в течение. Обхващаме ключови акценти от наскоро публикувания от Станфорд доклад "Индекс на изкуствения интелект за 2023 г.", който хвърля светлина върху нарастващата доминация на индустрията над академичните среди в създаването на значими модели за машинно обучение. Представяме и LMQL - нов език за програмиране с отворен код, който разширява възможностите на езикови модели като ChatGPT, GPT-4 и бъдещи модели.
Някои вълнуващи актуализации за BloombergGPT, голям езиков модел, специално разработен за финансите, и новия проект с отворен код на AWS, Data on EKS, който предоставя шаблони и насоки за разгръщане на работни натоварвания с данни в услугата Amazon Elastic Kubernetes.
И това не е всичко! Любопитни ли сте?
Заповядайте да се запознаете с бюлетина по-долу.
НОВИНИ
•••••••••••••••••••••••••••••••••••••••••••••••
▶️ Станфорд обяви доклада за индекса на изкуствения интелект за 2023 г.
"До 2014 г. най-значимите модели за машинно обучение бяха публикувани от академичните среди. Оттогава насам индустрията пое инициативата. През 2022 г. имаше 32 значими модела за машинно обучение, създадени от индустрията, в сравнение със само три, създадени от академичните среди. Изграждането на най-съвременни системи за изкуствен интелект все повече изисква големи количества данни, изчисления и средства - ресурси, които индустриалните участници по своята същност притежават в по-големи количества в сравнение с нестопанските организации и академичните среди."
Индексът за изкуствен интелект е независима инициатива на Станфордския институт за изкуствен интелект, ориентиран към човека (HAI), ръководена от Ръководния комитет на индекса за изкуствен интелект - интердисциплинарна група от експерти от академичните среди и индустрията. Годишният доклад проследява, събира, дестилира и визуализира данни, свързани с изкуствения интелект, като дава възможност на лицата, вземащи решения, да предприемат значими действия за отговорно и етично развитие на изкуствения интелект с оглед на хората.
▶️ Първата версия на LMQL е факт
LMQL е готов за използване, нов език за програмиране с отворен код и платформа за взаимодействие с езикови модели (LLM)! Съчетавайки заявки, определения и скриптове, LMQL повишава възможностите на LLMs като ChatGPT, GPT-4 и всеки бъдещ модел!
LMQL е декларативен език, подобен на SQL, базиран на Python, който разширява статичните текстови задачи с поток на управление, декодиране, управлявано от ограничения, и разширяване на инструментите. Тази форма на писане на скриптове значително опростява потоците на многокомпонентно подсказване с много малко необходим код. LMQL също така поддържа логически определения от високо ниво, които позволяват на потребителите да управляват генерирането на модели и да избягват скъпоструващи повторни запитвания и валидиране.
▶️ BloombergGPT: Голям езиков модел за финанси
Bloomberg пусна BloombergGPT - нов голям езиков модел (LLM), който е обучен на огромни количества финансови данни и може да помогне в редица дейности по обработка на естествен език (NLP) за финансовия сектор. BlooombergGPT е съвременен изкуствен интелект, който може бързо да оценява финансови данни, за да помага при оценката на риска, да измерва финансовите настроения и евентуално дори да автоматизира счетоводни и одиторски дейности.
AWS пусна Data on EKS (DoEKS) - проект с отворен код, предоставящ шаблони, насоки и най-добри практики за разгръщане на работни натоварвания с данни в Amazon Elastic Kubernetes Service (EKS). Макар че основният фокус е върху работата на Apache Spark в Amazon EKS, съществуват проекти и за други работни натоварвания с данни, като Ray, Apache Airflow, Argo Workflows и Kubeflow.
ИНТЕРЕСНИ AI СТАРТИРАЩИ КОМПАНИИ В РАЙОНА
•••••••••••••••••••••••••••••••••••••••••••••••
🔍 Чешкият инкубатор за стартъпи с изкуствен интелект стартира фонд от 20 млн. евро за подобряване на екосистемата на стартъпите с изкуствен интелект
Фондът Look AI Ventures (LAIV) SICAV се фокусира върху стартиращи предприятия с изкуствен интелект в предсеитбена и начална фаза от Европа, по-специално от региона на Централна и Източна Европа. Екипът има за цел да изгради портфолио на фонда от поне 35 стартъпа през следващите три години. Целевият инвестиционен талон в един стартъп е 250 хил. евро, с възможност за реинвестиране до 1 млн. евро.
"Digital First AI е асистент за личен растеж, който предоставя персонализирана маркетингова стратегия в рамките на няколко минути и помага на потребителите си да я изпълняват с помощта на AI. Въз основа на информацията за бизнеса Digital First след това препоръчва списък с маркетингови дейности, които ще позволят на компаниите да увеличат приходите си.
Миналата година стартъпът набра 1,1 млн. долара предварително финансиране за глобалното си разрастване и в момента се използва от над 4 000 компании потребители и над 2 000 клиенти от 60 държави." - пише Recursive.
ПОЛЕЗНИ РЕСУРСИ
•••••••••••••••••••••••••••••••••••••••••••••••
💡 Блог статия: From Deep to Long Learning
Изследователите работят за увеличаване на дължината на последователностите в моделите за машинно обучение, за да могат да се учат от по-дълги контексти и множество медийни източници.
Нови модели като S4, H3 и Hyena са разработени, за да се справят с квадратичното мащабиране на слоевете за внимание в Трансформатори и показват обещаващи резултати при съпоставяне на Трансформатори по задачи за недоумение и надолу по веригата.
💡 Изследване на MS: Сегментиране на всичко и навсякъде наведнъж
Despite the growing demand for interactive AI systems, there have been few comprehensive studies on human-AI interaction in visual understanding e.g. segmentation. Inspired by the development of prompt-based universal interfaces for LLMs, this paper presents SEEM, a promptable, interactive model for Segmenting Everything Everywhere all at once in an image.
Институтът по компютърни науки, изкуствен интелект и технологии (INSAIT) стартира поредица от лекции по най-актуалните теми, като невросимволичен изкуствен интелект, генеративен изкуствен интелект и геометрично дълбоко обучение, директно от технологичните лидери, изследователите и предприемачите, които ги създават. Предстоящата лекция ще бъде изнесена от проф. д-р Мартин Одерски, изобретател на езика за програмиране Scala, в София, на 27.04.2023 г. За да присъствате на нея, регистрирайте се на https://techseries.insait.ai/.
Благодарим ви, че четете нашия месечен бюлетин! Ако ви харесва, ще се радваме да ни помогнете да разпространим информацията! Споделете го с приятели и колеги, които биха могли да се възползват от него.
Темите от предишните бюлетини можете да намерите на адрес: