В мире88

Лянь Вэньфэн — таинственный основатель DeepSeek, который перевернул мир искусственного интеллекта

До 20 января лицо создателя китайского инструмента искусственного интеллекта не было известно широкой публике. В тот день 40-летнего мужчину показало китайское телевидение. Что о нем известно?

Лян Вэньфэн Liang Wenfeng Лян Вэньфен
Лян Вэньфэн (справа) во время встречи с премьером Госсовета Китая Ли Цян. Скрин фото: ShanghaiEyeMagic / YouTube

Еще несколько недель назад мало кто за пределами мира китайских финансов знал имя Лян Вэньфэна (Liang Wenfeng). 20 января по китайскому телевидению был показан сюжет о встрече премьер-министра Госсовета Китая Ли Цяна с небольшой группой экспертов в области искусственного интеллекта во главе с этим 40-летним мужчиной.

«Одет в светлый костюм и светло-серый свитер, когда все остальные выбрали темные пиджаки. Непослушные пряди волос небрежно падали на массивную оправу очков, что еще больше придавало его внешнему облику вид гика. Таким он появился впервые в главном выпуске новостей государственного телевидения в 7 вечера», — пишет Le Mond.

Для Китая это было первое знакомство с новым героем технологической гонки с США, который 20 января представил свою новую модель искусственного интеллекта DeepSeek-R1, открытую и бесплатную, созданную с использованием в разы меньшего финансирования и вычислительных мощностей.

Так кто же этот человек, создатель стартапа, который вызвал ажиотаж в Силиконовой долине и нервозность на Уолл-стрит?

Лян Вэньфэн, родился в 1985 году в портовом городе Чжанчжоу на юге Китая. Еще во время учебы в университете в Ханчжоу он увлекся финансовым моделированием, вдохновленный успехами хедж-фонда Renaissance.

Парень писал первые алгоритмы для анализа рынка, а в 2013 году, через несколько лет после получения диплома, вместе с однокурсниками основал количественный инвестиционный фонд, который использовал моделирование больших данных для прогнозирования рыночной динамики и частичной автоматизации инвестиционных решений.

В 2015 году, когда китайский фондовый рынок пережил бурный рост, а затем кризис, это открыло возможности для опытных трейдеров. Основанный в тот же год второй фонд Лян Вэньфэна, High-Flyer, принес значительную прибыль. К 2019 году его активы выросли с 1 до 10 миллиардов юаней (с 130 миллионов до 1,3 миллиарда евро).

Полноценно сосредоточившись на трейдинге с использованием ИИ, Вэньфэн инвестировал в вычислительные мощности: High-Flyer закупил суперкомпьютеры на 156 миллионов евро и успел приобрести 10 000 карток Nvidia A100 до введения санкций США против Китая в 2022 году. Но уже тогда его внимание было направлено дальше — на создание «общего искусственного интеллекта», который должен превзойти человеческий.

Лян Вэньфэн Liang Wenfeng Лян Вэньфен
Лян Вэньфэн в 2019 году. Фото: VCG/VCG via Getty Images

Создание DeepSeek

Инвестиции для DeepSeek Вэньфэн берет из High-Flyer и привлекает на работу молодых выпускников без опыта, считая, что «те, кто не знает готовых решений, ищут новые». Сам он продолжает писать код, читать научные статьи и участвовать в обсуждениях DeepSeek. Как отмечают эксперты, Китай имеет два ключевых преимущества: многочисленные таланты в математике и большие массивы данных для обучения ИИ.

DeepSeek нашел новый подход к обучению ИИ. В то время как другие модели просто накапливают знания, DeepSeek был обучен лучше искать ответы с помощью метода «обучения с подкреплением». При нем система сама задает себе вопросы и получает награды (например, дополнительные баллы или улучшение ее возможностей), если ее решения верны. Это делает ее менее быстрой, но значительно более эффективной в потреблении энергии.

В результате DeepSeek-R1 оказался до 27 раз дешевле OpenAI o1 в расчете на запрос. Кроме того, DeepSeek был обучен всего на 2 048 видеокартах, которые Nvidia теперь поставляет в Китай в ограниченном виде, что ставит под вопрос эффективность американских санкций.

Такой подход вызвал интерес даже в США. По мнению экспертов, эффективность китайской модели ИИ по отношению к стоимости делает их более доступными.

Однако DeepSeek имеет и свои ограничения. Модель склонна к генерации недостоверных фактов. Кроме того, при вопросах о политике или истории КНР она часто предлагает «поговорить о чем-то другом», что свидетельствует о встроенной цензуре.

Как отмечает издание, после запуска ChatGPT в 2022 году Китай столкнулся с американской превосходством в ИИ и технологическими ограничениями, введенными Вашингтоном. Первоначальные попытки китайских разработчиков не дотягивали до уровня OpenAI. Однако теперь DeepSeek убедил даже национальных лидеров в возможности технологической победы.

Сам Лян Вэньфэн заявляет, что больше не ищет богатства, а стремится к прорывам, чтобы Китай мог находиться в авангарде технологий. И теперь именно американские инженеры изучают код DeepSeek, чтобы увидеть его секреты.

Комментарии8

  • политзек
    31.01.2025
    а, простите, где и в каком месте он его перевернул?
    совершенно точно DeepSeek является подделкой. причем довольно неумелой и небрежной.
    иногда он себя раскрывает и считает, что то он ChatGPT, и даже иногда ЯндексGPT. большинство скользких вопросов игнорирует. спросите его про то, что произошло на площади Тяньаньмэнь. или какова ситуация с айгурами.
    и это все, что надо знать про "китайский" GPT.
    и ДА, открою секрет.. абсолютно ЛЮБОЙ может установить у себя на компьютере совершенно бесплатный GPT с открытым исходным кодом, и он никуда не будет отсылать ваши данные, ваши запросы, а обучить вы его сможете "под себя", под ваши интересы и брать данные там, где вы ему это разрешите.
    для ленивых и у кого забанен гугл - llama . com
  • бабруйчанін
    31.01.2025
    Ні разумею у гэтых " віртуал бізьнісе" схемах
    Але зачапіла у 2015 у 30 гадовага кітайца 130 млн$ на рахунку ???
    Адразу узгадал пачатак 90 х калі па целіку " вундэркінды" 25-30 разпрагалі аб сваіх фондах фінкампаніях аб сваіх хеніяльных здольнасцях..Шмат было ..
    Пасля знікалі як з'явілісь грошэй ні знайсці
    Я бачу " віртуал хенія" а у реале як у анекдоце
  • От коммунистов ничего хорошего не стоит ожидать
    31.01.2025
    Некоторые в интернете уже обратили внимание на пользовательское соглашение этого китайского «чуда», где написано, что все ваши данные, все ваши запросы, IP адреса и другая информация будет храниться и использоваться в интересах DeepSeek. И все это будет храниться на серверах Китайской народной республики и может быть использована в интересах Китая. Поэтому если вы будете пользоваться этим китайским дистиллятом, ни в коем случае не печатайте в боте ваши персональные данные или чувствительную информацию. Ибо вся эта информация может быть использована против вас коммунистическим режимом. Хотя чего еще можно было ожидать от коммунистов.

Сейчас читают

«Она забрала детей и вернулась в Минск»: история белоруса, который эмигрировал в Барселону с семьей, а остался один10

«Она забрала детей и вернулась в Минск»: история белоруса, который эмигрировал в Барселону с семьей, а остался один

Все новости →
Все новости

Камеры на дорогах все же начали фиксировать авто без техосмотра? Белорус показал, как получил штраф4

В Могилеве выпустили карамельный сыр3

Гродненец создал точную копию Фарного костела в миниатюре и печатает фигурки на 3D-принтере

Большой арабский комплекс на месте бывшего «Белэкспо» в Минске почти готов. Вот как он выглядит24

Николая Дедка не выпустят по истечении срока — его перевели в СИЗО в Колядичах1

Кто тот четвертый военнослужащий США, которого до сих пор ищут? 14

«В новом мире нет места для демократической Беларуси — разве что мы его сами придумаем». Астапеня и Крук рассуждают о будущем Беларуси18

С 1 апреля «Радыё Свабода» частично сворачивает деятельность. Все журналисты пражской редакции уходят в отпуск18

Сколько медиков не хватает в Беларуси и как эти цифры скрывают1

больш чытаных навін
больш лайканых навін

«Она забрала детей и вернулась в Минск»: история белоруса, который эмигрировал в Барселону с семьей, а остался один10

«Она забрала детей и вернулась в Минск»: история белоруса, который эмигрировал в Барселону с семьей, а остался один

Главное
Все новости →

Заўвага:

 

 

 

 

Закрыць Паведаміць