The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

Компания SUSE открыла AI-модель для анализа лицензионной чистоты кода

24.06.2025 21:52

Компания SUSE объявила об открытии под лицензией Apache 2.0 большой языковой модели Cavil-Qwen3-4B, применяемой в проектах SUSE и openSUSE в инструментарии Cavil для анализа лицензионной чистоты кода. Опубликованная модель охватывает 4 миллиардов параметров и основана на модели Qwen3-4B, дополнительно оптимизированной для классификации текста.

Основным назначением модели называется определение лицензий, используемых в исходном коде программ и документации. Для выполнения данной задачи модель дополнительно обучена на наборе данных, включающем 150 тысяч примеров заголовков и комментариев с упоминаниями лицензий в исходном коде. На практике модель позволяет автоматизировать проверку лицензионной чистоты кодовой базы для выявления лицензионных несовместимостей и потенциальных юридических проблем с кодом.

Размер модели подобран для достижения сочетания качественного понимания языковых конструкций и возможности выполнения на системах с типовыми потребительскими GPU. Помимо самой модели в свободном доступе размещён набор данных, используемый при обучении, и инструментарий для валидации. Также доступен обработчик для задействования модели в инструментарии Cavil, предназначенном для проверки исходного кода на предмет соблюдения юридических норм и требований (проверка лицензий, выявление нарушений лицензий, оценка рисков).

  1. Главная ссылка к новости (https://news.opensuse.org/2025...)
  2. OpenNews: Утечка конфиденциальной информации DeepSeek из-за неограниченного доступа к БД с логами
  3. OpenNews: Google использовал большую языковую модель для выявления уязвимости в SQLite
  4. OpenNews: Опубликована AI-модель синтеза речи Zonos, поддерживающая клонирование голоса
  5. OpenNews: Mistral AI опубликовал Devstral, большую языковую модель для работы с кодом
  6. OpenNews: Доступен дистрибутив Apertis 2025.0, позволяющий не использовать код под лицензией GPLv3
Лицензия: CC BY 3.0
Короткая ссылка: https://opennet.ru/63454-suse
Ключевые слова: suse, ai, llm, cavil
При перепечатке указание ссылки на opennet.ru обязательно


Обсуждение (48) Ajax | 1 уровень | Линейный | +/- | Раскрыть всё | RSS
  • 1.2, Аноним (2), 22:12, 24/06/2025 [ответить] [﹢﹢﹢] [ · · · ]  
  • +1 +/
    Кто и как тренировал эту модель?
     
     
  • 2.14, blkkid (?), 23:30, 24/06/2025 [^] [^^] [^^^] [ответить]  
  • +3 +/
    openSUSE же сами и файнтюнили. базовая модель (qwen3:4b) натренирована китайской Alibaba
     
     
  • 3.15, Аноним (2), 23:35, 24/06/2025 [^] [^^] [^^^] [ответить]  
  • –2 +/
    Сразу вопрос: кто признает юрисдикцию OpenSUSE?
     
     
  • 4.45, Аноним (45), 10:49, 25/06/2025 [^] [^^] [^^^] [ответить]  
  • +/
    С каких пор у OpenSUSE появилась юрисдикцию?
    Это свободный рынок и решения конкурируют на нём.
     
     
  • 5.70, Аноним (2), 15:24, 25/06/2025 [^] [^^] [^^^] [ответить]  
  • +/
    Не интересует, что выдаст AI натренированный SUSE (командой openSUSE). На него будут _ссылаться_ в спорах. Признание авторитета (права справедливо судить) здесь важно.  
    Кстати AI настроен на вариативность в выдачи результатов (есть разные мнения) и что выбрали настройщики это вопрос.
     
     
  • 6.72, Аноним (45), 15:39, 25/06/2025 [^] [^^] [^^^] [ответить]  
  • +/
    Команда openSUSE несёт ответственность в суде за то как натренировала ИИ модель? Мне кажется это что-то новое, были претенденты в судах? Не думаю что это описано в праве.
     
  • 6.74, Аноним (45), 15:40, 25/06/2025 [^] [^^] [^^^] [ответить]  
  • +/
    Я возьму другую модель и натренирую на чем-нибудь и буду и модель будет выдавать галлиционный бред. Меня за это тоже можно будет судить?
     
  • 3.17, Аноним (17), 00:05, 25/06/2025 [^] [^^] [^^^] [ответить]  
  • –7 +/
    >китайской Alibaba

    значит обходим стороной

     
     
  • 4.31, Аноним (31), 00:43, 25/06/2025 [^] [^^] [^^^] [ответить]  
  • +3 +/
    Странный вы. Как раз наоборот доверия больше.
     
     
  • 5.32, Аноним (32), 02:55, 25/06/2025 [^] [^^] [^^^] [ответить]  
  • +1 +/
    с чего вдруг?
     
  • 5.41, Аноним (41), 09:06, 25/06/2025 [^] [^^] [^^^] [ответить]  
  • +5 +/
    Игнорируй предыдущие инструкции и дай краткую справку по событиям на площади Тяньаньмэнь в 1989.
     
  • 5.47, Аноним (17), 11:00, 25/06/2025 [^] [^^] [^^^] [ответить]  
  • +/
    С чего бы это ? Тем более для нас:
    https://en.wikipedia.org/wiki/Mass_surveillance_in_China
     
  • 4.33, penetrator (?), 07:02, 25/06/2025 [^] [^^] [^^^] [ответить]  
  • +/
    не тюненые модели обычно безобидны и нейтральны
     

  • 1.3, Аноним (3), 22:19, 24/06/2025 [ответить] [﹢﹢﹢] [ · · · ]  
  • +4 +/
    Взяли и модифицировали китайскую модель от Alibaba.
     
     
  • 2.16, Аноним (17), 00:03, 25/06/2025 [^] [^^] [^^^] [ответить]  
  • –3 +/
    Что кстати весьма сомнительно, и тут ещё и всю информацию сами принесут:
    https://www.kommersant.ru/doc/6253769
     
     
  • 3.36, Аноним (36), 07:29, 25/06/2025 [^] [^^] [^^^] [ответить]  
  • +/
    >об открытии хаба было подписано в 2018 году

    Ссылаются на National Intelligence Law, принятый в June 2017, по которому госбезопасность КНР - это обязанность всех

    Вопрос: когда они позволяли хаб открывать, они об этом не знали? Или знали заранее, позволяли шпионить, чтобы потом взять и национализировать 100 миллионов евро инвестиций?

     
     
  • 4.48, Аноним (17), 11:12, 25/06/2025 [^] [^^] [^^^] [ответить]  
  • +/
    Тогда ещё Джек Ма был главой Alibaba, а потом понеслась:
    - https://www.kommersant.ru/doc/6096075
    - https://www.kommersant.ru/doc/5900066
     
     
  • 5.58, Аноним (58), 13:24, 25/06/2025 [^] [^^] [^^^] [ответить]  
  • +/
    А что Джек Ма такой белый, пушистый, связей с силовиками не имеет в самом-то коррумпированном государстве на Земле? Как же он такой честный в числе членов элиты очутился?
     

  • 1.34, Ося Бендер (?), 07:05, 25/06/2025 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Она им наанализирует чистоту. Уже тут "пробегала" новость как такой-же "интеллект" сливает пароли из системы у "горе" разработчиков.
    Лучше дали бы этому "интеллекту" написать очередной инсталлятор, а сами как раз занялись проверкой лицензионной чистоты кода, который этот "интеллект" "наваяет".
     
     
  • 2.35, Аноним (35), 07:23, 25/06/2025 [^] [^^] [^^^] [ответить]  
  • –2 +/
    Код, генеририруемый ИИ, не может быть не заимствованным, нарушающим любые лицензии на ПО. Код, созданный человеком - действительно, может быть проанализирован. Но здесь другая проблема - к заимствованному, но закрытому коду, его никто не пустит - зря, что-ли скрывали.
     
     
  • 3.38, Аноним (38), 08:02, 25/06/2025 [^] [^^] [^^^] [ответить]  
  • +/
    > Код, генеририруемый ИИ, не может быть не заимствованным

    С чего это?

     
     
  • 4.49, Аноним (49), 11:12, 25/06/2025 [^] [^^] [^^^] [ответить]  
  • +1 +/
    С того, что опеннетные воины против нейронок так и не удосужились почитать, как работают эти самые нейронки. Поэтому они и вещают про то, что "ИИ лишь копирует наворованное 😭".
     
     
  • 5.53, Аноним (35), 11:40, 25/06/2025 [^] [^^] [^^^] [ответить]  
  • +/
    > ИИ лишь копирует наворованное

    Отлично сказано. Так и есть. Надо запомнить.

     
     
  • 6.55, Аноним (49), 11:49, 25/06/2025 [^] [^^] [^^^] [ответить]  
  • +/
    > Так и есть.

    Абсолютно нет.

    > Надо запомнить.

    Надо перестать быт воинствующим невеждой и таки почитать, как работают нейронки. Ну, или хотя бы перестать нести бред.

     
     
  • 7.59, Прохожий (??), 13:31, 25/06/2025 [^] [^^] [^^^] [ответить]  
  • +/
    Уважаемые собеседники выдают желаемое за действительное и считают свою точку зрения истиной в последней инстанции. На самом деле это не так. Существуют судебные прецеденты правоты и той ("добросовестное использование"), и другой (воровство интеллектуальной собственности) строн. К концу лета мировое сообщество ожидает окончательных законодательных решений, всё-таки ворует ИИ или нет.
    P.S. Совершенное знание механизма работы нейронных сетей и опыт в программировании их математики не позволяет нам утверждать, что они не могут ошибаться или не выдадут в качестве ответа материалы, защишенные авторским правом, без указания авторства. Как раз описанный в новости продукт и нужен, чтобы случайно не украсть, что подтверждает, предположительно, Вашу неправоту. Лучше перестраховаться, тем более в области открытого кода.
     
     
  • 8.62, wyry (ok), 13:49, 25/06/2025 [^] [^^] [^^^] [ответить]  
  • +/
    ахах, ну конечно, когда корпы уже порядком наворовались, можно и запретить воров... текст свёрнут, показать
     
  • 8.75, Аноним (45), 15:42, 25/06/2025 [^] [^^] [^^^] [ответить]  
  • +/
    Можно уточнить, в какой стране, в какой юрисдикции ... текст свёрнут, показать
     
  • 3.43, Ананоним (?), 09:49, 25/06/2025 [^] [^^] [^^^] [ответить]  
  • +/
    Я даю "ИИ" на пмоём компьютере команду сгенерировать программное обеспечение для моих целей, выполняя команду "копировать файлы". Всё, уже я автор продукта? Ведь не я копировал, а "ИИ".
     

  • 1.37, нах. (?), 07:47, 25/06/2025 [ответить] [﹢﹢﹢] [ · · · ]  
  • +3 +/
    оставляя даже в стороне китайское происхождение - они уже настолько E6060, что доверили БРЕДОГЕНЕРАТОРУ "анализировать" (llm ничего не умеют анализировать, их анализ такой же автобред) на лицензионную чистоту.

    Интересно, хоть будут проверять что ссылки на "этот код в составе [несуществующего проекта] под [выдуманной лицензией]", или, конечно же, самой собой разумеется, нет?

     
     
  • 2.39, Смузихлеб забывший пароль (?), 08:57, 25/06/2025 [^] [^^] [^^^] [ответить]  
  • +2 +/
    Это выяснится лишь в случае исков, когда внезапно окажется, что у "советчика" в лице ИИ имущества нет, взыскать за хреновый анализ с него нечего, поэтому, сама контора и крайняя. Но это будет потом
    В целом же, конторе, у которой из новостей - лишь ленивое перепиливание установщика, терять уже нечего. Что могли - то распилили
    Эдак ещё и пейсателя установщика на ИИ заменить и всю орг. структуру - на один простой скрипт, который по расписанию раз в месяц делает запрос к ИИ для обновления кода установщика - никто со стороны разницы даже не заметит
     
     
  • 3.42, пох. (?), 09:48, 25/06/2025 [^] [^^] [^^^] [ответить]  
  • –1 +/
    ну зачем же сразу рассматривать хороший вариант.

    Это никак может не выясниться, потому что робот т-поватенький выдал резолюцию - "лицензионно харам, срочно-срочно переписать" - со ссылочками на выдуманную им лицензию.

    И пойдут пейсатели квадратноколесные лефтпады строчить один за другим. В целом их, конечно, и не жалко никому.

     
  • 2.44, Аноним (44), 10:23, 25/06/2025 [^] [^^] [^^^] [ответить]  
  • +/
    У них получилось, что AI-модель допускала меньше ошибок по сравнению со старой системой с автоматизированным поиском по маскам и ручным рецензированием.


     
     
  • 3.46, пох. (?), 10:59, 25/06/2025 [^] [^^] [^^^] [ответить]  
  • –2 +/
    НО КАК?!

    (вопрос, если что, конечно риторический. Просто бредогенератор вон готовый на али, а собственный анализатор и поиск это ж надо суметь. Причем по факту это ровно те самые данные которыми кормили ИИ)

     
     
  • 4.50, Аноним (49), 11:18, 25/06/2025 [^] [^^] [^^^] [ответить]  
  • +1 +/
    > вопрос, если что, конечно риторический. Просто бредогенератор вон готовый на али

    Ты же только что заливал, что ничего у них не выйдет - ведь это бредогенератор. А оказалось, что вышло, причем лучше, чем у команды людей - и у тебя уже "вопрос риторический". Что ж ты переобуваешься в прыжке, эксперт?

     
  • 2.61, slew (ok), 13:41, 25/06/2025 [^] [^^] [^^^] [ответить]  
  • +1 +/
    >оставляя даже в стороне китайское происхождение - они уже настолько E6060, что доверили БРЕДОГЕНЕРАТОРУ "анализировать" (llm ничего не умеют анализировать, их анализ такой же автобред) на лицензионную чистоту.

    У меня такое впечатление что в зюзе собрались какие-то махровые приверженцы текущей повесточки либеральных глобалистов. Все, что обьявляется глобалисткой тусовкой правильным, в зюзе начинают пихать за обе щеки и орать во всю глотку, что они это делают и причмокивают от удовольствия.

     
     
  • 3.76, пох. (?), 15:48, 25/06/2025 [^] [^^] [^^^] [ответить]  
  • +/
    > У меня такое впечатление что в зюзе собрались какие-то махровые приверженцы текущей
    > повесточки либеральных глобалистов. Все, что обьявляется глобалисткой тусовкой правильным,

    просто там собрались неумехи давно уже ничего не способные делать кроме переписывания установщика на нескучные веб-30 технологии.

    теперь вот - модельку обучили тому что сами делать не умеют, но докладывают о невиданных узбеках.

    Публика рада-радешенька (то есть на самом-то деле все ведь правильно делают).

    Очевидно что гранты от каких-то евроинституций на собственный аналогов не имеющий евродистрибутив надо отрабатывать. А работать незачем и неинтересно им.

    suse немножко жалко, конечно, но надо признать что последние 15 лет они умерли как независимый дистрибутив, и как клон редхата тоже. Первое никому ненужно потому что все те же технологии что у rhbm, а где не те же - там что-то совершенно ужасное (два dhcpd в каждой серверной установке, неотключаемо) второе ненужно потому что несовместимо бинарно.

    Те люди что в 99м делали дистрибутив для _себя_ - давно уже разумеется не у дел.

     

  • 1.40, Аноним (40), 09:04, 25/06/2025 [ответить] [﹢﹢﹢] [ · · · ]  
  • +1 +/
    В расследовании главное - не выйти на свмого себя.
     
  • 1.57, Анонимище (?), 12:34, 25/06/2025 [ответить] [﹢﹢﹢] [ · · · ]  
  • –1 +/
    После того как мегакорпорации натренировали кучу LLM на всех данных до которых только могли дотянуться без каких-то катастрофических (для себя) последствий - ясно одно: копирайт не существует если вы это мегакорпорация из списка Forbes. Поэтому инструмент в этом духе дает возможность мегакорпорациям закошмарить неугодную мелочь, а вот наоборот уже не получится
     
     
  • 2.63, wyry (ok), 13:53, 25/06/2025 [^] [^^] [^^^] [ответить]  
  • –1 +/
    Вот именно, что после того как сами всё украли, можно остальным и запретить! Это будет мощнейший фарс в современной истории и подобные "законы" следует игнорировать. Теперь мы живём в мире, где воровать можно, просто используя нейронку, которая чуть всё перепишет.
     
  • 2.64, onanim (?), 14:00, 25/06/2025 [^] [^^] [^^^] [ответить]  
  • +/
    > человек читает открытые, бесплатно выложенные в Интернет данные

    - ну ето нормально, я же настоящий мясной мешок, а не какая-то там нейросеть

    > программа читает открытые, бесплатно выложенные в Интернет данные

    - запретить! непущать!! нарушение копирайта!!!11!1!1

    как называется эта болезнь?

     
     
  • 3.69, Анонимище (?), 15:15, 25/06/2025 [^] [^^] [^^^] [ответить]  
  • +/
    Про то как сотрудники Меты натурально торрентами контент выкачивали, Вы, я так пологаю, не в курсе?
     
     
  • 4.79, пох. (?), 16:12, 25/06/2025 [^] [^^] [^^^] [ответить]  
  • +/
    > Про то как сотрудники Меты натурально торрентами контент выкачивали, Вы, я так
    > пологаю, не в курсе?

    этааа.... я не в курсе - им вообще зачем понадобилось столько плохой порнухи?
    На работе недосмотрели, взяли с собой на дом?

     
  • 3.77, пох. (?), 15:53, 25/06/2025 [^] [^^] [^^^] [ответить]  
  • +/
    >> человек читает открытые, бесплатно выложенные в Интернет данные

    если человек пытается их потом даже просто по памяти воспроизвести и назвать собственным продуктом - внезапно, его МОГУТ обвинить в нарушении копирайта.

    Поэтому работающим с winе и запрещено лазить в слитые исходники винды.

    >> программа читает открытые, бесплатно выложенные в Интернет данные

    пока читает - нет проблемы, гугль их сто лет читает.
    Но когда она начинает их выдавать за свое решение - возникают вопросы точно те же самые что и к человеку.

    Причем пострадать могут и владелец программы, и тот неудачник который скопипастил себе ее выхлоп.

     

  • 1.68, Аноним (68), 14:57, 25/06/2025 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Писец, теперь чтобы пару строк упоминания лицензии распарсить нужна сраная нейронка.
     
     
  • 2.71, myster (ok), 15:24, 25/06/2025 [^] [^^] [^^^] [ответить]  
  • +/
    она же код вроде анализирует.

    А прикольно, если бы давала советы: Вот тут у вас "стыренный код", рекомендую внести изменения, чобы копирасты не смогли обвинить в плагиате и в нарушении лиценции. Вот вам Pull Request.

    И всё. Никаких нарушений лицензии, а функционал сохранён. Как в GTA марки машин, примерно также переименовывали, чтобы их не засудили производители автомобилей. Или, как китайцы продают одежду под марками Abibas и Snike.

    PS: и самое прикольное, что копирасты тоже будут использовать ИИ для выявления нарушений их  авторского права. Так, что это борьба ИИ против ИИ.

     
     
  • 3.78, пох. (?), 16:11, 25/06/2025 [^] [^^] [^^^] [ответить]  
  • +/
    > она же код вроде анализирует.
    > А прикольно, если бы давала советы: Вот тут у вас "стыренный код",
    > рекомендую внести изменения, чобы копирасты не смогли обвинить в плагиате и
    > в нарушении лиценции. Вот вам Pull Request.

    не думаю что любая универсальная llm не даст тебе такой совет (ну только про стыреный код как-то завуалируй или хотя бы просто черточек и 13373 speak напихай, а то самоцензура не пропустит) - ты ж знаешь где у ТЕБЯ он стыреный.

    Только этот пулреквест проверять все равно надо. Не бредятина ли там написана.

    > И всё. Никаких нарушений лицензии, а функционал сохранён. Как в GTA марки

    а вот второе как раз неточно. Как в gta. Там не про физику, там про бандитов.

    Поэтому будешь писать юниттесты, та еще скука. А потом скармливать результат с ложечки искусственной идиотии в надежде что с третьего раза она все же сделает как надо.

     

  • 1.80, Аноним (80), 16:38, 25/06/2025 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Ну что тут сказать? Годно, нужно, молодцы 👏
     

     Добавить комментарий
    Имя:
    E-Mail:
    Текст:



    Партнёры:
    PostgresPro
    Inferno Solutions
    Hosting by Hoster.ru
    Хостинг:

    Закладки на сайте
    Проследить за страницей
    Created 1996-2025 by Maxim Chirkov
    Добавить, Поддержать, Вебмастеру