Российские ученые создали бенчмарк для повышения качества медицинских консультаций

Медицинский бенчмарк оценивает не только точность диагностики, но и качество диалога между врачом и пациентом

Медицинский бенчмарк моделирует консультации между врачом и пациентом на основе жалоб, снимков и характера пациента

Фото: Валерий ЗВОНАРЕВ. Перейти в Фотобанк КП

Ученые из Центра практического искусственного интеллекта Сбера разработали медицинский бенчмарк 3MDBench, который моделирует консультации между врачом и пациентом на основе жалоб, снимков и характера пациента, с автоматической оценкой качества. Об этом эксперты рассказали в ходе международной конференции AI Journey («Путешествие в мир искусственного интеллекта»).

В этой системе взаимодействуют два виртуальных агента, каждый из которых управляется большой языковой или мультимодальной моделью искусственного интеллекта (AI). Один агент действует как врач, а другой — как пациент. Смысл в том, чтобы оценить, насколько эффективно современные AI-модели решают задачи врача, который консультирует пациентов дистанционно. Система проверяет их способность распознавать симптомы, формулировать диагноз и поддерживать естественный, понятный и эмпатичный диалог с пациентом. Такая симуляция позволяет изучить, как темперамент пациента и выбранная стратегия общения влияют на точность диагностики и общее качество взаимодействия.

Актуальность исследования обусловлена стремительным развитием телемедицины и растущей ролью языковых моделей в здравоохранении. Существующие медицинские бенчмарки часто включают лишь тесты с выбором ответа или короткие текстовые задачи, не моделируют полноценное общение между врачом и пациентом, не учитывают темперамент и эмоциональную реакцию человека. К тому же большинство из них берут в расчет качество коммуникации и визуальные данные — например, фотографии симптомов, которые важны для постановки диагноза.

Бенчмарк 3MDBench включает почти 3000 случаев с 34 диагнозами, которые основаны на реальных мультимодальных телемедицинских данных (текст + изображение). Исследование показало, что использование диалога и мультимодальной информации существенно повышает точность диагностики. Добавление диалогов, по оценкам ученых Сбера, увеличивает F1-меру на 6,5%, а включение информации от специально обученной сверточной нейросети для классификации медицинских изображений — до 20%. Также подтверждено, что мультиагентная симуляция с персонализированными пациентами обеспечивает более реалистичную и содержательную оценку моделей.

Компании, которые разрабатывают медицинские ИИ-системы и телемедицинские платформы, могут бесплатно использовать 3MDBench для оценки и улучшения диагностических возможностей своих нейросетей в реалистичных условиях. Интеграция мультимодальных данных и улучшение диалоговых стратегий помогут компаниям-разработчикам, телемедицинским провайдерам, страховым компаниям и производителям медицинского ПО повысить качество удалённых консультаций.

Новости соседних регионов по теме:

Сложная операция была проведена кардиохирургами Курской областной больницы и Бакулевского центра Кардиохирурги регионального сосудистого центра Курской областной больницы и Центра сердечно-сосудистой хирургии им.
16:58 24.11.2025 РИА Курск - Курск
С начала 2025 года четырнадцать юных пациентов из Херсонской области получили необходимую медицинскую помощь в Детской краевой больнице Краснодара.
13:02 24.11.2025 Губернатор Херсонской области - Херсон
Учёные из Центра практического искусственного интеллекта Сбера разработали медицинский бенчмарк 3MDBench, который моделирует консультации между врачом и пациентом на основе жалоб, снимков и характера пациента,
18:21 24.11.2025 Baikal24.Ru - Иркутск
Медицинский бенчмарк оценивает не только точность диагностики, но и качество диалога между врачом и пациентом Ученые Сбера создали бенчмарк для повышения качества медицинских консультаций Фото:
15:37 24.11.2025 ChitaMedia - Чита
Медицинский бенчмарк оценивает не только точность диагностики, но и качество диалога между врачом и пациентом Ученые Сбера создали бенчмарк для повышения качества медицинских консультаций Фото:
14:01 24.11.2025 IrkutskMedia.Ru - Иркутск
Учёные из Центра практического искусственного интеллекта Сбера разработали медицинский бенчмарк 3MDBench, который моделирует консультации между врачом и пациентом на основе жалоб, снимков и характера пациента,
13:07 24.11.2025 SIA.RU - Иркутск
Ученые исследуют вопрос разумности искусственного интеллекта Ученые из исследовательского центра AE Studio провели эксперимент, который может пролить свет на вопрос о разумности искусственного интеллекта.
20:43 23.11.2025 Реальное время - Казань
  Наряду с поликлиниками и больницами, фельдшерско-акушерские пункты подключены к Интернету.
15:40 22.11.2025 Газета Наша жизнь - Бабаево
Фото: вести35.рф Фельдшерско-акушерские пункты в муниципалитетах были подключены к сети Интернет.
15:22 22.11.2025 ГТРК Вологда - Вологда
В Чувашской Республике в следующем году планируют начать апробацию медицинского сервиса с использованием искусственного интеллекта, который будет предоставлять так называемое «третье мнение» при диагностике.
12:49 22.11.2025 Знамя Труда - Ядрин
Владимир Путин поручил правительству и главам регионов создать штаб по внедрению генеративного искусственного интеллекта.
10:43 22.11.2025 ЛенТВ24 - ЛенОбласть
 
По теме
В Самарской области обнаружили 20 нарушений правил посещения памятников природы Всего составлено восемь материалов.