Thursday, November 30, 2023

Обучение без учителя

"Для внедрения ИИ в практику нужны серьезные технические решения, к которым готовы далеко не все медучреждения, сказывается и дефицит кадров в этой области, добавляет гендиректор сервиса онлайн-расшифровки снимков «Честная медицина» Дмитрий Росляков. Михаил Виноградов основную проблему видит в том, что ИИ приходится учиться в том числе на снимках, где врач не выделил патологию, никак не прокомментировал данные и не подтвердил диагноз."

Отсюда

Tuesday, November 28, 2023

Управляемые нейронные сети

Steerable Neural Networks. Расширение для CNN, когда возможна не только трансляция, нои другие преобразования (повороты и т.п.)

Забудь все это

Программные подходы к стиранию памяти LLM

См. также другие публикации, посвященные LLM

Friday, November 17, 2023

LLM оценивает LLM

Использование LLM для оценки LLM

См. также другие публикации, посвященные LLM

Как учить LLM

В порядке борьбы с галлюцинациями: данные берутся из внешних источников. LLM отвечает за интепретацию полученных данных в контексте запроса.

Отсюда

См. также другие публикации, посвященные LLM

Sunday, November 12, 2023

Нюансы Redis

Хорошее описание деталей работы с Redis

См. также другие публикации, посвященные Redis

Friday, November 10, 2023

О контрфактических примерах

On the Practical Generation of Counterfactual Examples

One of the important elements in evaluating the stability of machine learning systems are the so-called adversarial examples. These are specially selected or artificially created input data for machine learning systems that interfere with their normal operation, are interpreted or processed incorrectly. Most often, such data are obtained through some formal modifications of the real source data. This article considers a different approach to creating such data, which takes into account the semantic significance (meaning) of the modified data - counterfactual examples. The purpose of the work is to present practical solutions for generating counterfeit examples. The consideration is based on the real use of counterfactual examples in assessing the robustness of machine learning systems.

Картинки из текста

Практическое применение text-to-image генераторов: создание состязательных примеров для тренировки систем распознавания изображений

Tuesday, November 07, 2023

О состязательных тренировках

Регулярный поход к возмущению исходных данных для построения устойчивых моделей анализа трафика. Интересная и практическая идея.

Monday, November 06, 2023

Инверсия черного ящика

Атака инверсии модели (восстановление приватных тренировочных данных) в режиме черного ящика. Довольно впечатляющие результаты. От атакуемой модели известны только метки (результаты работы).

См. также другие публикации по теме adversarial, посвященные устойчивому машинному обучению

Вижу поле боя

Интересная работа по военному зрению - A Review of Intelligent Vision Enhancement Technology for Battlefield

Saturday, November 04, 2023

Оглянись назад

Интересная техника задания вопросов LLM - Step-Back Prompting. Формирование абстрактных знаний для цепочки рассуждений.

См. также другие публикации, посвященные LLM

Friday, November 03, 2023

Где ваши тесты?

"...developers must watermark generated outputs and share results of safety tests conducted by so-called red teams" - из американского закона о безопасных системах ИИ.

См. также другие публикации, посвященные Red Team

Thursday, November 02, 2023

Знай это !

Руководство по загрузке фактов в LLM. RAG - retrieval augmented generation

См. также другие публикации, посвященные LLM

Wednesday, November 01, 2023

Про работу

Очень правильный текст от рекрутера из Linkedin. Именно так и нужно делать. Один момент добавлю к тому, что ниже. Домашняя работа - изучите и другие вакансии в компании. Нужно понять про компанию - кто они? Постарайтесь понять, что (кто) им нужно на самом деле. Кто они в технологиях (стек, архитектуры и т.п.). И исходя их этого и правьте (настраивайте) резюме.

Поиск работы за рубежом - это навык. Ему можно научиться, но важно разобраться, как именно работает система.

Очень важно, какую историю вы о себе рассказываете. Ваша история должна быть последовательна, из неё должно быть очевидно, как именно вы росли в профессию.

Затачивайте весь свой бэкграунд под конкретную вакансию или под ту позицию, которую ищете (если речь про публичное резюме или профиль в Linkedin).
Зачем это делать:
Никто не догадается, что вы идеально подходящий кандидат, пока вы это не объясните в резюме.
Если работодатель не увидит в вашем резюме, чем ваш опыт релевантен задачам вакансии, вы получите отказ.
Вас может спасти прямой рефёрал, который поручится, что вы норм. Но на всех работодателей рефёралов не напасёшься.

Как описывать опыт, если кратко: вот что я делал, вот каких результатов добивался, вот такая ответственность у меня была, вот так я развивался как профессионал в течении нескольких лет
Резюме нужно затачивать под позицию, под тип позиции и даже под индустрию.
Очень важно показывать правильные ключевые слова, правильное описание того, что вы делали.
Везде нужно описывать достижения и/или результаты.

Со стороны почти никогда не понятно, кто вы как профессионал. Люди — не телепаты! Поэтому, делайте краткое Summary в начале вашего резюме, чтобы объяснить незнакомому человеку, в чем именно вы профи.
Summary должен быть очень релевантно той позиции, на которую вы подаётесь.

Компания вас нанимает не для того, чтобы закрыть вакансию, а для того, чтобы решить какую-то бизнес-задачу.
Работодатель хочет увидеть, что у вас уже есть релевантный опыт, который компания хочет купить. Чтобы это показать, опишите в своём резюме результаты, которые вы достигали ранее и заточите их под требования вакансии. Если работодатель видит, что вы достигали ровно таких результатов, которые нужны компании, он априори считает, что вы способны решить задачу его бизнеса.

Руководство по визуализации

Объемное руководство по визуализации данных

P.S. см. также другие публикации, посвященные визуализации данных

Прогнозирование для временных рядов

Авторы утверждают, что их метод - лучший в классе. Найдено - здесь