Aktualności - Instytut Podstaw Informatyki Polskiej Akademii Nauk

Powstanie pierwszy polski otwarty wielki model językowy (PLLuM) i inteligentny asystent

Artykuły prasowe o tej tematyce:

Nauka w Polsce; 02.12.2023
NASK; 02.12.2023
więcej artykułów o PLLuM pod linkiem "Czytaj Więcej"

Polski wielki model językowy PLLuM, wytrenowany na treściach głównie polskojęzycznych, oraz oparty na nim inteligentny asystent - powstaną w ramach współpracy sześciu polskich jednostek naukowych. “Nie stać nas na to, by zostawać w tyle”- komentują przedstawiciele projektu.

Konsorcjum PLLuM (Polish Large Language Universal Model) powstało 29 listopada br. (w przeddzień pierwszych urodzin chatGPT). Tworzy je sześć spośród wiodących w Polsce jednostek naukowych z obszaru sztucznej inteligencji i językoznawstwa: Politechnika Wrocławska (lider konsorcjum), Państwowy Instytut Badawczy NASK (PIB NASK), Ośrodek Przetwarzania Informacji – Państwowy Instytut Badawczy (OPI PIB), Instytut Podstaw Informatyki PAN, Uniwersytet Łódzki oraz Instytut Slawistyki PAN. O powołaniu konsorcjum poinformowali w piątek w przesłanym PAP komunikacie przedstawiciele PIB NASK.

Od około roku wielkie językowe modele generatywne (LLMs) zachwycają niewyobrażalnymi dotychczas możliwościami sztucznej inteligencji. Te najbardziej znane modele, jak ChatGPT czy Google Bard, mają jednak swoje ograniczenia: są płatne, są zamknięte (nie można poznać ani modyfikować ich algorytmów) i zostały wytrenowane ze zbyt małym udziałem treści polskojęzycznych (dlatego w polskich odpowiedziach pojawia się więcej błędów niż w języku angielskim).

Stąd pomysł, aby stworzyć otwarty, darmowy model w większości wytrenowany na treściach polskojęzycznych, a także opracować wykorzystującego ten model inteligentnego asystenta. “Całość projektu ma być przeprowadzona zgodnie z dobrymi praktykami etycznej i odpowiedzialnej sztucznej inteligencji, w tym przy zachowaniu reprezentatywności, przejrzystości i sprawiedliwości danych” - zapewniają przedstawiciele projektu. Istotną rolę odegra tu Krajowe Centrum Doskonałości Danych z siedzibą w NASK-PIB.

Więcej…Powstanie pierwszy polski otwarty wielki model językowy (PLLuM) i inteligentny asystent (PAP)

Narodowe Centrum Nauki ogłosiło wyniki konkursów OPUS 25 i PRELUDIUM 22

Dwóch naukowców Instytutu Podstaw Informatyki PAN otrzyma finansowanie z Narodowego Centrum Nauki w ramach konkursu OPUS 25 na badania podstawowe.

Wśród 176 wniosków zakwalifikowanych do finansowania znalazły się wnioski

prof. Adama Przepiórkowskiego pt. "Koordynacja: symetryczna czy asymetryczna?" z grupy badań nad językoznawstwem, projekt najwyżej oceniony przez ekspertów w panelu dyscyplin HS2 - Kultura i twórczość kulturowa oraz,
dra Dariusza Kalocińskiego, pt.: "Obliczalna teoria modeli i filozofia strukturalizmu matematycznego" z grupy badań nad logiką, filozofią nauki oraz teoretycznymi podstawami informatyki, oceniany w panelu HS1 - Fundamentalne pytania o naturę człowieka i otaczającej go rzeczywistości.

Więcej…Narodowe Centrum Nauki ogłosiło wyniki konkursów OPUS 25 i PRELUDIUM 22

Nowe metody klasyfikacji dla danych z niepełną obserwowalnością

Zespół Analizy i Modelowania Statystycznego osiągnął istotne wyniki dotyczące dwóch nowych metod uczenia maszynowego dla danych z niepełną dostępnością etykiet (dane typu Positive Unlabeled) w istotnym dla zastosowań przypadku, gdy ich dostępność jest zależna od charakterystyk badanych jednostek. W pierwszej zaproponowanej metodzie badano nowy parametryczny model generacji tego typu danych i iteracyjną procedurę estymacji jego parametrów. Druga metoda bazuje na koncepcji wariacyjnych autoenkoderów w połączeniu z technikami wykrywania obserwacji odstających. Poza teoretycznym uzasadnieniem metod, pokazano eksperymentalnie istotnie lepszą jakość wynikowych klasyfikatorów dla danych tabularycznych i obrazowych.

Obie metody zostały przedstawione na międzynarodowej konferencji European Conference on Artificial Intelligence, ECAI 2023, która odbyła się w Krakowie w dniach 30.09-04.10.2023.

Więcej…Nowe metody klasyfikacji dla danych z niepełną obserwowalnością

Konkurs na analizę wystąpień z parlamentów

Instytut Podstaw Informatyki PAN – członek konsorcjum CLARIN-PL, części Europejskiej Infrastruktury Badawczej CLARIN (Common Language Resources and Technology Infrastructure), ogłasza konkurs na analizę danych parlamentarnych na bazie wielojęzycznego korpusu ParlaMint – zestawu wystąpień z parlamentów 26 krajów i regionów autonomicznych zapisanych we wspólnym formacie, opatrzonych anotacją lingwistyczną i dostępnych do pobrania i przeszukiwania. Obecne wydanie korpusu zawiera także tłumaczenia wystąpień na język angielski.

Szczegóły konkursu na stronie CLARIN-PL.

Więcej…Konkurs na analizę wystąpień z parlamentów

10 lat otwartej infrastruktury naukowej CLARIN w Polsce

Fot. Archiwum Politechniki Wrocławskiej

W dniach 25-27 września na Politechnice Wrocławskiej odbyła się konferencja zorganizowana z okazji jubileuszu 10 lat otwartej infrastruktury naukowej CLARIN w Polsce. W 2013 roku konsorcjum CLARIN-PL otrzymało pierwsze fundusze z Ministerstwa Nauki i Szkolnictwa Wyższego na finansowanie zakupu i wytworzenia aparatury naukowo-badawczej CLARIN-PL: wspólne zasoby językowe i infrastruktura technologiczna. CLARIN-PL jest polskim wkładem w infrastrukturę naukową CLARIN ERIC, która tworzona jest przez 26 krajów Unii Europejskiej i krajów członków stowarzyszonych. Przedsięwzięcie CLARIN-PL zostało wpisane na Polską Mapę Drogową Infrastruktury Badawczej w 2011 roku.

Na konferencji jubileuszu 10-lecia zostały zaprezentowane m.in. najnowsze narzędzia i zasoby językowe opracowane przez pracowników Instytutu Podstaw Informatyki PAN powstałe w ramach przedsięwzięcia CLARIN-PL.

Więcej…10 lat otwartej infrastruktury naukowej CLARIN w Polsce

Aktualności Instytutu Podstaw Informatyki PAN

Powstanie pierwszy polski otwarty wielki model językowy (PLLuM) i inteligentny asystent

Narodowe Centrum Nauki ogłosiło wyniki konkursów OPUS 25 i PRELUDIUM 22

Nowe metody klasyfikacji dla danych z niepełną obserwowalnością

Konkurs na analizę wystąpień z parlamentów

10 lat otwartej infrastruktury naukowej CLARIN w Polsce

Więcej artykułów…