diff --git a/_posts/2019-04-30-ocr.md b/_posts/2019-04-30-ocr.md
index 2fb2c47..ac5dcc2 100644
--- a/_posts/2019-04-30-ocr.md
+++ b/_posts/2019-04-30-ocr.md
@@ -1,23 +1,18 @@
---
-title: Распознавание текста на изображениях
+title: Как создать алгоритм распознавания текста на изображениях
date: 2019-04-30
minutes: 8
---
-Как потомки героев войны могут отследить боевой путь своих предков?
-В послевоенные годы в архивых страны накопилось множество документов
-обо всех призывника, их назначениях, боевом пути, а также их судьбе.
-Оцифровка этих документов - трудоемкий и долгий процесс, ускорить которой
-вполне возможно за счет технологии распознавания текста (OCR).
+Как потомки участников войны могут отследить боевой путь своих предков? В послевоенные годы в архивах страны накопилось множество документов о судьбе, боевом пути и назначениях людей, участвовавших в войне. Оцифровка этих документов - долгий и трудоемкий процесс, ускорить которой возможно благодаря технологии распознавания текста – OCR.
### Как это работает
-Как и многие другие задачи в компьютерном зрении распознавание текста в картинках
-состоит из двух этапов:
-1. Найти текст в изображении
-2. Распознать символы, буквы и цифры, найденные на первом этапе
+Как и многие другие задачи в компьютерном зрении распознавание текста на картинках состоит из двух этапов:
+1. Поиск текста на изображении.
+2. Разпознавание букв, цифр и символов, найденных на первом этапе.
-_Возьмем как пример такое изображение_
+_В качестве примера возьмем такое изображение_
@@ -25,53 +20,37 @@ _Поиск текста на изображении_
-С использованием открытого детектора текста нам удалось найти 55 текстовых областей.
-Причем заметно, что горизонтальный текст обнаруживается лучше (более точные прямоугольники)
-вне зависимости от размера и шрифта. Также отметим, насколько хорошо детектор видит
-пробелы - слова на 1 строке попали в разные прямоугольники.
+С использованием открытого детектора текста нам удалось найти 55 текстовых областей. Причем заметно, что горизонтальный текст благодаря более точным прямоугольникам обнаруживается лучше вне зависимости от размера и шрифта. При этом пробелы после слов на первой строке попали в разные прямоугольники.
_Распознавание обнаруженного текста_
-Как видим, в случаях когда текст ровный ("BOADRDING", "MARS", "2020"), четко видны буквы и цифры,
-алгоритму [tesseract-ocr](https://github.com/tesseract-ocr/tesseract/wiki)
-легко удается правильно определить весь текст. Хорошая точность достигается
-за счет рекуррентных нейросетей, которые лучше всего справляются с последовательностью данных.
-Однако когда появляется некий шум как в примерах ("STATION", "SCHEDULED") в результате добавляются ненужные символы.
-На последних двух изображениях не удается определить легитимного текста вообще: пример того,
-как ошибки первого этапа поиска текста влияют на распознавание текста.
-
-### Адаптация OCR под свою задачу
-
-Тогда как возможно использовать открытые алгоритмы, для достижения наивысшей точности
-целесообразно обучить нейронные сети для работы с собственным
-набором данных. Обучение алгоритмов также происходит в 2 этапа: детекция текста и распознавание.
-При обучении потребуются размеченные данные в большом количестве, что может быть затратно
-для небольших и средних компаний, поэтому возможно комбинировать собственный массив текстовых изображений с
-открытыми наборами данных. Нередко для увеличения обучающей выборки данные синтезируются
-самими разработчиками.
-
-При обучении собственного алгоритма также учитывается целевое применение. Если алгоритм
-должен работать на мобильных устройствах или в режиме реального времени, то выбираются легковесные
-модели; если предполагается, что изображения содержат немного текста, то можно объединить детекцию
-и распознавание в 1 модель для увеличения скорости обработки.
+Если текст ровный ("BOADRDING", "MARS", "2020") и четко видны буквы и цифры, алгоритму [tesseract-ocr](https://github.com/tesseract-ocr/tesseract/wiki) легко удается правильно определить текст. Хорошая точность достигается
+за счет рекуррентных нейросетей, которые лучше справляются с последовательностью данных.
+
+Однако, если возникает какой-либо шум, как в примерах ("STATION", "SCHEDULED"), то в результате добавляются ненужные символы.
+На последних двух изображениях не удается определить текст. Это пример того, как ошибки первого этапа поиска текста влияют на его распознавание.
+
+### Адаптация OCR под вашу задачу
+
+Учитывая возможность использовать открытые алгоритмы, для достижения наивысшей точности целесообразно обучить нейронные сети для работы с собственным набором данных. Обучение алгоритмов также происходит в два этапа: детекция текста и распознавание.
+
+В процессе обучения потребуется большое количество размеченных данных. Это может быть затратно для небольших и средних компаний, поэтому возможно комбинировать собственный массив текстовых изображений с открытыми наборами данных. Нередко для увеличения обучающей выборки разработчики самостоятельно синтезируют данные.
+
+При обучении собственного алгоритма нужно учитывать целевое применение. Если алгоритм должен работать на мобильных устройствах или в режиме реального времени, целесообразно выбрать легковесные модели. Если изображения содержат немного текста, то для увеличения скорости обработки можно объединить детекцию и распознавание в единую модель.
источник
-При обучении нейронных сетей под свою задачу можно достичь такого же результата, как на изображении выше.
-Алгоритмы достаточно хорошо находят текст и оцифровывают его, причем распознается только целевой текст и
-правильно классифицирует такие схожие сущности как имя и фамилия, серия и номер, и т.д.
-Высокое качество достигается за счет обработки сразу нескольких последовательных кадров, что
-позволяет снизить уровень шума.
+При обучении нейронных сетей под собственную задачу вы сможете достичь такого же результата, как на изображении выше.
+Алгоритмы достаточно хорошо находят текст и оцифровывают его. Причем алгоритм распознает только целевой текст. Затем система правильно классифицирует такие схожие сущности как имя и фамилия, серия и номер, и т.д. Высокое качество достигается за счет обработки сразу нескольких последовательных кадров, что позволяет снизить уровень шума.
### Рукописный текст
-В разпознавании рукописного текста иная ситуация. На данный момент нет универсальных алгоритмов, которые могли бы применяться
-для любого рукописного текста хотя бы на 1 языке. Данная проблема решается посегментно - в большинстве случаев
-компании могут решать свои узкоспециализированные задачи за счет оцифровки рукописного текста.
+Иная ситуация с разпознаванием рукописного текста. На данный момент нет универсальных алгоритмов, которые могли бы применяться
+для любого рукописного текста хотя бы на одном языке. Проблема решается посегментно - в большинстве случаев компании могут решать узкие задачи благодаря оцифровке рукописного текста.
_Оцифровка рукописного текста с помощью открытых алгоритмов_
@@ -80,24 +59,21 @@ _Оцифровка рукописного текста с помощью отк


-Для увеличения качества распознавания лиц на следующем шаге будет целесообразно отфильтровать изображения низкого качества, например:
-- выбрать изображения определенной высоты и ширины, таким образом, мы только будем анализировать людей, которые находятся в интересующей нас зоне поиска. Нижние и верхние пороги вычисляем эмпирически;
-- отсеить нефронтальные и перекрытые лица, так как алгоритм распознавания лиц точнее определяет схожесть, когда есть полное изображение лица;
-- удалить размытые изображения, которые часто встречаются на потоках видео с камер без высокой четкости.
+Для улучшения качества распознавания лиц на следующем шаге целесообразно отфильтровать изображения низкого качества, например:
+- Выбрать изображения определенной высоты и ширины. Таким образом, мы будем анализировать людей, которые находятся в интересующей нас зоне поиска. Нижние и верхние пороги вычисляем эмпирически;
+- Отсеить нефронтальные и перекрытые лица, так как алгоритм распознавания лиц точнее определяет схожесть, когда есть полное изображение лица;
+- Удалить размытые изображения, которые часто встречаются на потоках видео с камер без высокой четкости.
Вот так выглядят нефронтальные изображения лиц, которые мы вычисляем на основании расположения ключевых точек: нос, рот и глаза:
@@ -49,28 +51,27 @@ author: Rustem G
##### 2. Распознавание лиц
-На данном этапе мы должны создать векторные преставления лиц с помощью моделей распознавания лиц, в точности как в задаче идентификации по лицу, для того чтобы мы могли сравнить схожесть лиц попарно, как на картинке ниже (лица одно и того же человека будут иметь низкие значения):
+На этом этапе мы должны создать векторные представления лиц с помощью моделей распознавания, в точности как в задаче идентификации по лицу. Это необходимо, чтобы сравнить схожесть лиц попарно, как на картинке ниже (лица одного и того же человека будут иметь низкие значения):
-В некоторых случаях необходимо обучить алгоритм распознавания лиц так, чтобы качество изображений совпадало с качеством изображений в используемой камере. Это необходимо, так как если обучать алгоритм распознавания на фотографиях с высокой четкостью, то модели будут совершать множество ошибок на маленьких изображениях с видеоряда.
+В некоторых случаях алгоритм распознавания лиц нужно обучать на изображениях, совпадающих с качеством камеры. Камеры наблюдения в магазинах обычно записывают видео с невысоким разрешением. Если обучать алгоритм по фотографиям высокой четкости, то на изображениях низкого качества модели будут совершать множество ошибок.
##### 3. Кластеризация лиц
Теперь обучаем несколько алгоритмов кластеризации на полученных векторах с предыдущего шага и выбираем наиболее подходящий в зависимости от ограничений по вычислительным ресурсам, времени на обработку и точности.
-Подбираем методы, которые сами умеют определять количество кластеров, так как мы не можем знать заранее, сколько человек собираются посетить нашу торговую точку. Помимо самой кластеризации, проводим дополнительную пост-обработку: объединяем близкие кластеры и
-разделяем кластеры с низким значением внутренней схожести.
+Мы не можем знать заранее, сколько человек собираются посетить нашу торговую точку. Поэтому подбираем методы, которые сами умеют определять количество кластеров. Помимо кластеризации проводим дополнительную пост-обработку: объединяем близкие кластеры и разделяем кластеры с низким значением внутренней схожести.
-Соответственно, финальное количество кластеров будет равняться количеству уникальных посетителей, а в каждом кластере будут представлены лица одного и того же человека.
+Финальное количество кластеров будет равно количеству уникальных посетителей, а в каждом кластере будут представлены лица одного и того же человека.
#### 4. Дополнительная аналитика
-Сгруппировав изображения людей в кластеры, рассчитать время и длительность посещений не составит большого труда.
+Если сгруппировать изображения людей в кластеры, то не составит большого труда рассчитать время и длительность посещений.
-Для проведения демографического анализа потребуется обучение дополнительных алгоритмов распознавания пола и возраста. Далее мы применим эти алгоритмы для каждого кластера лиц и выберем наиболее частое значения для максимизации точности.
+Для проведения демографического анализа потребуется обучение дополнительных алгоритмов распознавания пола и возраста. Далее мы применим эти алгоритмы для каждого кластера лиц и выберем наиболее частые значения для максимизации точности.
| Распознавание возраста в группы 15-20, 25-35 или 40-50 лет | Определение пола (m - мужской, f - женский ) |
| :------------- | :------------- |
@@ -78,4 +79,4 @@ author: Rustem G
## Результаты
-Добиться очень высоких результатов достаточно сложно, так как качество видеосъемки ниже, чем на фотографиях. Однако представленный подход способен решить задачу на приемлемом уровне для использования в системах, которые не требует медицинской точности или в качестве пред-обработки данных для визуальной верификации человеком. Другим важным уроком для нас стало то, что при работе с потоком видео критическую роль играет подготовка данных для моделей: чем меньше мусора мы подавали на вход, тем меньше мусора получали на выходе.
+Качество видеосъемки ниже, чем на фотографиях. Поэтому добиться результатов высокой точности достаточно сложно. Однако описанный подход способен решить задачу на приемлемом уровне. Полученные результаты можно применять в системах, не требующих медицинской точности или в качестве пред-обработки данных для визуальной верификации человеком. Также мы выяснили: при работе с потоком видео критическую роль играет подготовка данных для моделей. Чем меньше мусора мы подавали на вход, тем меньше ошибок получали на выходе.
diff --git a/_posts/2020-05-01-start.md b/_posts/2020-05-01-start.md
index c304016..26dc80a 100644
--- a/_posts/2020-05-01-start.md
+++ b/_posts/2020-05-01-start.md
@@ -1,123 +1,82 @@
---
-title: Где начать?
+title: Как начать трансформацию компании в эпоху искусственного интеллекта?
date: 2020-05-01
minutes: 7
author: Rustem G
---
-Краткий пересказ [схемы Эндрю Ына](https://landing.ai/ai-transformation-playbook/)
-по трансформации компании в эпоху __искусственного интеллекта__.
+Переводить компанию или корпорацию на использование технологии искусственного интеллекта нужно поэтапно. Об этом писал в своей [дорожной карте](https://landing.ai/ai-transformation-playbook/) по трансформации бизнеса в эпоху __искусственного интеллекта__ Эндрю Ын, всемирно известный исследователь алгоритмов машинного обучения и основатель Landing AI.
-> ИИ покорит все сферы экономической деятельности,
-также как электричество 100 лет назад.
-По оценкам к 2030 году добавленная стоимость в мировой ВВП составит
-**13 триллионов долларов**.
+> ИИ охватит все сферы экономической деятельности, также как электричество 100 лет назад. Оценивается, что к 2030 году добавленная стоимость в мировой ВВП составит **13 триллионов долларов**, – пишет Эндрю Ын.
-## Основные этапы
+## Основные этапы ИИ-трансформации
-#### 1. Пилотный проект
+#### 1. Пилотный проект и внешняя команда
-Начать нужно с выделения одной проблемы, которую можно решить с помошью ИИ.
-Она должна быть решаема в краткосрочной перспективе и
-достаточно заметной, чтобы ее устранение
-привлекло внимание высшего руководства.
+Компания преуспеет быстрее, если начнет ИИ-трансформацию с решения какой-то одной проблемы с использованием ИИ. Задача должна быть заметной и решаемой в краткосрочной перспективе. Это с большей вероятностью привлечет внимание высшего руководства организации.
-Выполнение задачи можно возложить на внешнюю команду, с четко определенными
-бизнес показателями.
+Для пилотного проекта в сфере ИИ можно привлечь внешнюю команду. Главное при этом четко определелить целевые бизнес показатели.
-По завершении, необходимо измерить успех и донести информацию до других команд,
-чтобы вовлечь их интерес к решению новых задач.
+В завершение проекта измерьте результаты и проинформируйие о них другие команды. Это поможет пробудить в них интерес и привлечь к решению новых задач.
#### 2. Внутренняя команда
-Для достижения долгосрочных целей целесообразно построить команду
-ИИ энтузиастов внутри компании. Это повлечет за собой создание или адаптацию
-вычислительной инфраструктуры, включение в процесс найма соответствующих
-специалистов, кооперацию между различными подразделениями и т.д.
+Для достижения долгосрочных целей постройте команду ИИ энтузиастов внутри компании. В дальнейшем создайте или адаптируйте вычислительную инфраструктуру, наймите профильных специалистов, проведите кооперацию между различными подразделениями. В процессе нужно будет решать и другие важные задачи, но главное выстроить сквозной процесс.
-Состав команды может включать:
- - членов высшего руководства - с их поддержкой будет легче добиваться
- заметных результатов
- - продакт-менеджеров - они понимают продукты компании, видят узкие места
- и могут оценить, где внедрение машинного обучения будет максимально полезно
- - специалистов по анализу больших данных и машинному обучению - техническое
- решение проблем будет возложено на них
+В команду включите:
+- членов высшего руководства - с их поддержкой будет легче добиться заметных результатов
+- продакт-менеджеров - они понимают продукты компании, видят узкие места и могут выделить сферы, где внедрение машинного обучения будет максимально полезно
+- специалистов по анализу больших данных и машинному обучению - на них будет возложено техническое решение проблем
-Наличие внутренной команды будет являться ключевым фактором создания
-**конкурентного преимущества** на рынке.
+Создание внутренной команды впоследствие станет ключевым **конкурентным преимуществом** на рынке.
#### 3. Обучение
-Широкое обучение об основных принципах ИИ является необходимым элементом
-ввиду ряда причин:
- - новыe подходы решения старых задач вызывают сопротивление у консерваторов
- - отсутствие ответов на вопросы "как, сколько и для чего" вызывает естественные
- страхи
- - дефицит специалистов на внешнем рынке
-
-Для адаптации сотрудников компании к новым реалиям предалагется разбить
-обучающихся на 3 группы:
- 1. Менеджмент высшего звена. Для них важно понимать, какие выгоды может
- принести ИИ и какие инвестиции потребуются.
- 2. Руководители подразделений. Вопросы, которые предстоить решить этой группе,
- включают в себя постановку целей, выделение ресурсов и отслеживание прогресса.
- 3. Инженеры и исследователи, т.е. кадры, которые будут непосредственно
- заниматься сбором данных, построением моделей машинного обучения и
- промышленным внедрением.
+Команда, обученная основным принципам ИИ, – сильная команда. Именно с обучения стоит начать движение по пути внедрения ИИ в жизнь компании.
+Что это даст:
+ - новыe подходы в решении задач
+ – возможность преодолеть сопротивление консерваторов
+ - ответы на вопросы "Как?", "Сколько?" и "Для чего?"
+ - сокращения дефицита специалистов
+
+Начните обучение с деления команды на 3 группы:
+ 1. Менеджмент высшего звена. Для них важно понимать, какие выгоды может принести ИИ и какие инвестиции потребуются.
+ 2. Руководители подразделений. Вопросы, которые предстоить решить этой группе, включают в себя постановку целей, выделение ресурсов и отслеживание прогресса.
+ 3. Инженеры и исследователи, т.е. кадры, которые будут непосредственно заниматься сбором данных, построением моделей машинного обучения и промышленным внедрением.
#### 4. Стратегия развития
-Составление стратегии развития не должно происходить в самом начале;
-ее понимание придет последовательно с внедрением новых решений.
+Не начинайте с формирования стратегии развития. Понимание, что включить в стратегию, придет последовательно по мере внедрения новых решений.
-Стратегия может включать 3 направления развития:
- 1. Определить ключевые точки применения ИИ в рамках глобальных целей развития
- компании, выделить факторы роста конкурентоспособности
- 2. Сконцентрировать усилия на сборе релевантных данных:
- приобретение внешних данных, создание единого хранилища и организация
- доступа для вовлеченных сотрудников
- 3. Развитие инфраструктуры для управления процессом разработки новых моделей,
- их внедрение и мониторинг.
+Стратегия может включать 3 области:
+ 1. Ключевые точки применения ИИ в рамках глобальных целей развития компании как факторы роста конкурентоспособности.
+ 2. Аспекты получения релевантной информации: внешних данных, создания единого хранилища и организация доступа для вовлеченных сотрудников.
+ 3. Формирование инфраструктуры для управления процессом разработки новых моделей, их внедрение и мониторинг.
#### 5. Внутренние и внешние коммуникации
-Успех трансформации зависит от поддержки ключевых лиц как внутри самой
-компании, так и снаружи. Исходя из этого, важно вовремя информировать их
-и получать обратную связь.
+Успех трансформации зависит от поддержки ключевых лиц как внутри самой компании, так и во внешней среде. Поэтому важно поддерживать постоянные коммуникации, доводить информацию и получать обратную связь.
-**Акционеры и инвесторы.** Объяснить цели и ожидаемый финансовый эффект от
-внедрения новых технологий.
+**Акционеры и инвесторы.** Объясните им цели и ожидаемый финансовый эффект от внедрения новых технологий.
-**Регуляторы.** Донести четкое видение ценности для индустрии в частности или
-общества в целом, в особенности, для социального значимых решений, таких как
-автономные транспортные средства или анализ медицинских данных.
+**Регуляторы.** Компании, создающие ИИ-решения в отраслях, регулируемых правительством, таких как автономные транспортные средства или анализ медицинских данных, встречают новые препятствия на своем пути. Для создания или поддержания положительного имиджа необходимо донести до общества четкое видение ценности нововведений для всей индустрии.
-**Покупатели и пользователи продукции.** Адаптировать маркетинговые кампании и
-внешние коммуникации для предотвращения негативного восприятия.
+**Покупатели и пользователи продукции.** Адаптировать маркетинговые кампании и внешние коммуникации для предотвращения негативного восприятия.
-**Хантинг и найм.** Продемонстрировать новейшие разработки, чтобы привлечь
-кадры, или провести хакатоны, чтобы показать примеры решаемых проблем.
-Разработчки хотят работать в компаниях открытых к изменениям и с интересными
-проектами.
+**Хантинг и найм.** Чтобы привлечь новых сотрудников, продемонстрируйте возможности компании, особенности организации рабочего процесса и планы по развитию ИТ-инфраструктуры. Проводите хакатоны, чтобы продемонстрировать сферу интересов организации и получить новые оригинальные решения внутренних задач. Разработчки хотят работать в компаниях, открытых к изменениям, где реализуются интересные проекты.
-**Внутренние коммуникации.** Рассказать о целях и этапах трансформации.
-Любые изменения могут создать страхи (например потеря работы)
-или вызвать сопротивление (желание сохранить все как есть). Важно избежать
-таких проблем через донесение своевременной и правдивой информации.
+**Внутренние коммуникации.** Расскажите собственным сотрудникам о целях и этапах трансформации. Любые изменения могут рождать страхи (например потеря работы) или вызывать сопротивление (желание сохранить все как есть). Важно избежать таких проблем, своевременно донося правдивую информацию.
## В заключение
-Ожидания и результаты могут не всегда соответствовать друг другу.
+Ожидания не всегда соответствуют реальности.
$$ Обычная компания + технологии машинного обучения \ne ИИ-компания $$
-Успех будет зависеть от многих факторов включая:
- - готовность организации трансформироваться вместе с внедрением новых технологий
+Успех будет зависеть от многих факторов, в том числе:
+ - готовности организации трансформироваться вместе с внедрением новых технологий
- инвестиций в необходимые ресурсы
- - умение понимать ИИ и принимать правильные решения
+ - понимания специфики внедрения и использования ИИ
+ – готовности принимать смелые решения
-> ИИ-трансформация достаточно сложный процесс, который станет возможным
-благодаря правильным партнерам. Процесс может занять от 2 до 3 лет, хотя
-первые результаты можно ожидать в течение 6-12 месяцев. В то же время,
-инвестиции в технологии ИИ позволят вашей компании опередить конкурентов и
-и улучшить процессы внутри самой компании.
+> ИИ-трансформация достаточно сложный процесс, который станет возможным благодаря правильным партнерам. Процесс может занять несколько лет. Однако, как пишет Эндрю Ын, первые результаты можно ожидать в течение 6-12 месяцев. В то же время, инвестиции в технологии ИИ позволят вашей компании опередить конкурентов и улучшить процессы внутри самой компании.