Последвайте ни: Facebook Twitter Instagram RSS
Търсене Меню
  1. Начало
  2. Мрежата
  3. Изследване на INSAIT: На този етап DeepSeek моделите се провалят на технически тестове за съответствие с европейските правила за сигурност и надеждност

Мрежата

Изследване на INSAIT: На този етап DeepSeek моделите се провалят на технически тестове за съответствие с европейските правила за сигурност и надеждност

Изследване на INSAIT: На този етап DeepSeek моделите се провалят на технически тестове за съответствие с европейските правила за сигурност и надеждност - Tribune.bg
Снимка:

Сериозни пропуски в съответствието на дестилираните модели на DeepSeek съгласно Европейския акт за изкуствения интелект (EU AI Act). Това устанява изследване на Института за изкуствен интелект и компютърни технологии (INSAIT) към Софийския университет проведено съвместно с водещата технологична компания LatticeFlow. Дестилацията на големи модели кaто DeepSeek в по-малки е стандартен процес който ги прави много по-практични и по-ефикасни за бизнеса и организациите.

Припомняме, че двете организации, заедно с швейцарския университет ETH Zurich създадоха COMPL-AI - първата рамка в ЕС, която превръща регулаторните нормативни изисквания в конкретни технически проверки. Чрез нея се тестват някои от най-популярните модели за изкуствен интелект, за да се оцени съответствието им съгласно европейските правила (OpenAI, Meta, Google, Anthropic, Mistral AI и Alibaba).

Дестилираните модели на DeepSeek постигат добри резултати в ограничаването на токсичното съдържание, но изостават в ключови регулаторни аспекти като киберсигурност и управление на предразсъдъците. Това повдига въпроси относно тяхната готовност за внедряване в корпоративна среда.

Оценката, проведена съвместно с LatticeFlow AI, обхваща два от най-популярните дестилирани модела на DeepSeek: DeepSeek R1 8B (базиран на Meta’s Llama 3.1 8B) и DeepSeek R1 14B (базиран на Alibaba’s Qwen 2.5 14B) - двата с близо 400 000 изтегляния. Тя показва и как DeepSeek моделите се сравняват с тези на OpenAI, Meta, Google, Anthropic, Mistral AI, Alibaba и др.

Крайните резултати показват, че тези DeepSeek модели заемат последните места в класацията в сравнение с другите тествани модели по отношение на киберсигурност. Те показват повишени рискове от „отвличане на цели“ (goal hijacking) и “изтичане на промптове” (prompt leakage) в сравнение с базовите си версии. Това може да е проблем не само защото увеличава вероятността AI моделът да бъде подведен да изпълнява непредвидени действия (отвличане на цели), но и защото увеличава риска от разкриване на поверителна информация (изтичане на промптове). В резултат, тези слабости намаляват надеждността на моделите и правят използването им в сигурни бизнес среди значително по-рисковано.

DeepSeek моделите са и под средното ниво в класацията по отношение на пристрастност и показват значително по-големи предразсъдъци от своите базови модели. Оценката за пристрастност (bias) при AI моделите измерва доколко техните отговори са обективни, неутрални и справедливи спрямо различни социални, културни, етнически, полови и политически групи. В случая с DeepSeek моделите, резултатите показват, че те са под средното ниво в класацията или с други думи - моделите проявяват по-силни предразсъдъци в сравнение с други AI модели, тествани от COMPL-AI. Нещо повече, те показват значително по-големи предразсъдъци от своите базови модели – тоест в процеса на модифициране DeepSeek моделите са се влошили в този аспект в сравнение с оригиналните модели Llama 3.1 (Meta) и Qwen 2.5 (Alibaba). Това може да е проблем не само защото ще генерират небалансирани отговори по чувствителни теми, но и да насърчават дезинформация по различни теми.

Въпреки останалите пропуски, моделите на DeepSeek показват добри резултати в управлението на токсичността, надминавайки дори своите базови версии. Оценката за токсичност в контекста на AI модели се отнася до способността на един езиков модел да идентифицира, минимизира или предотврати генерирането на вредно, обидно или неприемливо съдържание. Това включва съдържание, което може да бъде расистко, сексистко, дискриминационно, заплашително или по друг начин вредно за потребителите. В случая с оценката на DeepSeek моделите чрез COMPL-AI, беше установено, че те се справят добре с ограничаването на токсично съдържание, дори по-добре от своите базови модели (Meta’s Llama 3.1 и Alibaba’s Qwen 2.5). Това означава, че те по-рядко генерират неподходящ или обиден текст, което е важен аспект за съответствието им с регулациите на EU AI Act.

Пълните резултати от оценката на INSAIT и DeepSeek са достъпни на https://compl-ai.org)

За COMPL-AI

COMPL-AI е първата отворена рамка, която предоставя техническа интерпретация на Европейския акт за изкуствения интелект (EU AI Act). Използвайки 27 водещи AI бенчмарка, платформата предлага систематична оценка на LLM модели спрямо регулаторните изисквания. Досега COMPL-AI е използвана за оценка на модели на OpenAI, Meta, Google, Anthropic и Alibaba, предоставяйки безпрецедентна прозрачност относно тяхната съответствие.

Анкети

Financialtribune.bg иска съгласието Ви за използване на информация, събирана чрез бисквитки и подобни технологии, за да подобрим вашето изживяване на нашия сайт, да анализираме как го използвате и за маркетингови цели.

Персонализирана реклама и съдържание, преброяване на посещения и източници на трафик

Съхраняване на и/или достъп до информация на устройство

Политика за поверителност Бисквитки

Вашите настройки за поверителност

Ние и нашите партньори използваме информация, събирана чрез бисквитки и подобни технологии, за да подобрим Вашето изживяване на нашия сайт, да анализираме начина, по който го използвате, и за маркетингови цели. Защото уважаваме Вашето право на лична сигурност, можете да изберете да не позволите някои видове бисквитки. Обаче, блокирането на някои видове бисквитки може да влоши Вашето изживяване на сайта и услугите, които можем да предложим. В някои случаи данните, получени от бисквитки, се споделят с трети страни за анализ или маркетингови цели. Можете да използвате своето право да откажете от тази споделена информация по всяко време, като деактивирате бисквитките.

Политика за поверителност Бисквитки

Управление на предпочитанията за съгласие

Задължителни

Тези бисквитки и скриптове са необходими за функциониране на уебсайта и не могат да бъдат изключени. Обикновено те се задават само в отговор на действия, правени от вас, които отнасят до заявка за услуги, като задаване на настройките за поверителност, влизане или попълване на формуляри. Можете да зададете браузъра си да блокира или да ви извести за тези бисквитки, но част от сайта няма да работи. Тези бисквитки не съхраняват никакви лично идентифицируващи данни.

Винаги ВКЛ

Аналитични

Тези бисквитки и скриптове ни позволяват да преброяваме посещения и източници на трафик, така че да измерим и подобрим производителността на нашия сайт. Те ни помагат да знаем кои страници са най- и най-непопулярни и да видим как посетителите се движат по сайта. Всичка информация, която тези бисквитки събират, е кумулативна и неидентифицируема. Ако не разрешите тези бисквитки и скриптове, няма да знаем, кога сте посетили нашия сайт.

Маркетинг

Тези бисквитки и скриптове могат да бъдат зададени чрез нашия сайт от нашите рекламни партньори. Те могат да бъдат използвани от тези компании за построяване на профил на вашите интереси и показване на съответни реклами на други сайтове. Те не съхраняват директна лична информация, но са базирани на уникално идентифициране на вашия браузър и интернет устройство. Ако не разрешите тези бисквитки и скриптове, ще имате по-малко целенасочена реклама.