Det kinesiske selskapet Baidu har lansert to nye kunstige intelligensmodeller, den multimodale Ernie 4.5 og en ny modell fokusert på resonnering kalt X1. Selskapet kunngjorde dette og forklarte at Ernie 4.5-modellen har ”utmerkede multimodale forståelsesevner. Den har mer avanserte språkkunnskaper, og dens evner innen forståelse, generering, logikk og hukommelse er betydelig forbedret.”
Videre har den ”høy QE” og kan lett forstå internettmemer og satiriske tegneserier, sa Baidu. Den kinesiske teknologigiganten, som var en av de første til å lansere en ChatGPT-lignende chatbot, har hatt problemer med å oppnå bred adopsjon for sin store språkmodell Ernie, til tross for påstander om ytelse på nivå med OpenAIs GPT-4, midt i sterk konkurranse. Multimodale AI-systemer kan behandle og integrere ulike typer data, inkludert tekst, video, bilder og lyd, og kan konvertere innhold til disse formatene.
X1 har ”sterkere evner innen forståelse, planlegging, refleksjon og utvikling,” sa Baidu, og la til at det er den første dype tenkningsmodellen som bruker verktøy autonomt.