Інформаційний синтез системи автоматичного розпізнавання бланків документів
Мета роботи – розробити інформаційне та програмне забезпечення системи розпізнавання рукописних символів. Методи дослідження – інформаційно–екстремальна інтелектуальна технологія. Результати – розроблено алгоритм та програмне забезпечення системи розпізнавання символів, що навчається в рамках інформаційно-екстремальної інтелектуальної технології.
Зміст ВСТУП.. 4 1 АНАЛІЗ ПРОБЛЕМИ ТА ПОСТАНОВКА ЗАДАЧІ5 1.1 Огляд методів розпізнавання образів. 5 1.2 Методи оброблення та розпізнавання рукописних символів. 8 1.3 Постановка задачі та формування завдань дослідження. 16 2 ОПИС МЕТОДУ РОЗПІЗНАВАННЯ РУКОПИСНИХ СИМВОЛІВ.. 19 2.1 Основні ідеї інформаційно-екстремального методу розпізнавання рукописних символів. 19 2.2 Математична модель системи розпізнавання рукописних символів. 23 2.3 Критерій оптимізації параметрів функціонування системи розпізнавання. 25 2.4 Базовий алгоритм навчання. 26 2.5 Алгоритм екзамену. 30 3 ІНФОРМАЦІЙНЕ ТА ПРОГРАМНЕ ЗАБЕЗПЕЧЕННЯ СИСТЕМИ РОЗПІЗНАВАННЯ РУКОПИСНИХ СИМВОЛІВ.. 32 3.1 Оброблення рукописних символів. 32 3.2 Оптимізація контрольних допусків на ознаки розпізнавання системи розпізнавання. 34 3.4 Короткий опис програми. 36 3.5 Результати фізичного моделювання. 37 4 ОХОРОНА ПРАЦІ42 4.1 Характеристика приміщення. 43 4.2 Аналіз стану охорони праці в приміщенні45 4.3 Висновки. 55 ВИСНОВКИ.. 57 СПИСОК ЛІТЕРАТУРИ.. 58 Додаток. 61
ВСТУП Незважаючи на те, що електронні методи знайшли широке впровадження при автоматизації документообігу і діловиробництва, але існує велика кількість підприємств та організацій, в котрих надходження інформації ззовні неможливе без участі паперових документів. Ця проблема особливо актуальна в банках, податкових інспекціях та інших подібних закладах. У зв’язку з цим загострилась проблема автоматичного введення і розпізнавання рукописної інформації. У теперішній час технічно не складно перетворити паперовий документ в цифровий формат. Для цього можна скористатися сканером, цифровою фото або відео камерою. Якщо перетворення паперових документів в цифровий вигляд можна вважати вирішеною проблемою, то розпізнавання введеного документа все ще залишається актуальним. Хоч і створені програми розпізнавання друкованих документів з прийнятною якістю розпізнавання, але більшість розроблених систем дають великі похибки при обробці текста низької якості, чи текста з різним рівнем яскравості. Якщо ж говорити про розпізнавання рукописних документів, то можна сказати, що результатів, задовільних на практиці, ще не отримано. Тема дипломної роботи є актуальною, оскільки вона присвячена розпізнаванню рукописних символів, що до теперішнього часу залишається невирішеною проблемою. У дипломній роботі розглядається задача підвищення функціональної ефективності системи розпізнавання рукописних символів, що дозволяє з більшою достовірністю і оперативністю приймати управлінські рішення, обробляти великі масиви текстової інформації, здійснювати факсимільну передачу оригіналів підписів і фінансових документів.
1 АНАЛІЗ ПРОБЛЕМИ ТА ПОСТАНОВКА ЗАДАЧІ 1.1 Огляд методів розпізнавання образів Найбільш ефективними методами виведення нових знань є методи розпізнавання образів на основі навчання (самонавчання) [1, 2, 3]. Виділяють такі способи відображення знань: 1. Інтенсіональне відображення – у вигляді схеми зв’язків між атрибутами (ознаками). 2. Екстенціональне відображення – за допомогою конкретних фактів (об’єкти, приклади). Інтенсіональне відображення фіксує закономірності і зв’язки, якими пояснюється структура даних. Відповідно до діагностичних задач така фіксація полягає у визначенні операцій над атрибутами (ознаками) об’єктів, що призводять до потрібного діагностичного результату. Інтенсіональне зображення реалізуються за допомогою операцій над значенням атрибутів і не припускають операцій над відповідними інформаційними фактами (об’єктами). У свою чергу, екстенціональне відображення знань пов’язане з описом і фіксацією конкретних об’єктів з предметної галузі і реалізоване в операціях, елементами котрих являються об’єкти як цілісні системи. Описані вище два фундаментальні способи зображення знань дозволяють запропонувати таку класифікацію методів розпізнавання образів (табл. 1.1):
Таблиця 1.1 Класифікація методів розпізнавання Класифікація методів розпізнавання Область застосування Обмеження (недоліки) Методи розпізнавання Інтенсіональні методи Методи, основані на оцінках плотності розподілу значень ознак (або подібність і розбіжність об’єктів) Задачі з відомим розподілом , як правило нормальним, необхідна наявність великої кількості статистичних даних Відсутність ототожнення. Необхідність в переборі всієї навчальної вибірки при розпізнаванні, висока чутливість до непредставницької навчальної вибірки та артефактів. Методи, основані на припущеннях про клас вирішальних функцій Класи повинні бути добре роздільними, система ознак - ортонормованою Відсутність ототожнення. Повинен бути попередньо відомий вид вирішальної функції. Неможливість врахування нових знань про кореляцію серед ознак Логічні методи Задачі невеликої розмірності простору ознак Відсутність ототожнення. При відборі логічних вирішальних правил (кон’юнкцій) необхідний повний перебір. Висока обчислювальна робота Лінгвістичні (структурні) методи Задачі невеликої розмірності простору ознак Відсутність ототожнення. Задача відновлення(визначення)граматики по певній множині висловлювань (опису об’єктів), являється важкою для формалізації. Невирішеність теоретичних проблем. Методи порівняння з прототипом Задачі невеликої розмірності простору ознак Відсутність ототожнення. Висока залежність результатів класифікації від міри відстані (метрики) Метод k-найближчих сусідів Задачі невеликої розмірності по кількості класів та ознак Відсутність ототожнення. Висока залежність результатів класифікації від міри відстані (метрики). Необхідність повного перебору навчальної вибірки при розпізнаванні. Трудоємність при обчисленні. Алгоритм обчислення оцінок (голосування) АОО Задачі невеликої розмірності по кількості класів та ознак Відсутність ототожнення. Залежність результатів класифікації від міри відстані (метрики). Необхідність повного перебору навчальної вибірки при розпізнаванні. Висока технічна складність методу. Колективи вирішальних правил Задачі невеликої розмірності по кількості класів та ознак Відсутність ототожнення. Висока технічна складність методу,невирішеність ряду теоретичних проблем, як при виділенні області компетенції часткових методів, так і самих часткових методах Аналіз перспективних напрямів розвитку методів розпізнавання показує, що для успішного досягнення мети дослідження необхідно вирішити (або обійти) такі проблеми: 1) комбінаторного вибуху; 2) досягнення незалежності часу розпізнавання від обсягу навчальної вибірки; 3) корекція зниження розмірності простору ознак без відчутної втрати значимої інформації; 4) досягнення високої валідності результатів аналізу; 1.2 Методи оброблення та розпізнавання рукописних символів 1.2.1 Двовимірне дискретне косинусне перетворення Надійність розпізнавання значною мірою залежить від якості зображення символів, яке визначається формою символів або стилем написання і способом виконання. Алгоритм двомірного дискретного косинусного перетворення [4, 5, 7] реалізується наступним виразом: , де , ;
; ФункціяB = dct 2 ( A ) повертає результат двомірного дискретного косинусного перетворення для матриці А. Матриця В має той же розмір, що і матриця А , і відображає коефіцієнти дискретного косинусного перетворення. Функція B = dct 2 ( A , m , n ) повертає результат двомірного дискретного косинусного перетворення для матриці А розміром m х n . Якщо розмір матриці А менший, вона доповнюється нульовими елементами до заданого розміру. МатрицяА може включати елементи класу double або любого класу integer . МатрицяВ має елементі класу double . 1.2.2 Двовимірне зворотнє дискретне косинусне перетворення Алгоритм зворотного дискретного косинусного перетворення [4, 5, 8] реалізується наступним виразом: , де , , , Функція B = idct 2 ( A ) повертає результат двомірного зворотного дискретного косинусного перетворення для матриці А . Результат повертає у вигляді матриці В . Функція B = idct 2 ( A , m , n ) повертає результат двомірного зворотного дискретного косинусного перетворення з розміром матриць А і В m х n . Якщо розмір матриціА менший, вона доповнюється нульовими елементами до заданого розміру. Матриця А може включати елементи класу double або любого класу integer . МатрицяВ має елементі класу double . 1.2.3 Пряме перетворення Радона Пряме перетворення Радона [4, 6, 8] використовується для полутонового зображення, представленого матрицею І . У результаті перетворення отримаємо матрицю проекцій R . Дане перетворення зводиться до обчислення проекцій зображення на осі, що задаються кутом відносно горизонталі по часовій стрілці. Матриця І повинна мати елементи, що відносяться до класу double або любому іншому класу integer . Алгоритм прямого перетворення Радона заключається в обчисленні проекцій зображення відносно конкретних напрямків. Так, проекція функцій двох змінних f ( x , y ) на вісь задається лінійним інтегралом: , де осі та задаються поворотом проти часової стрілки на кут з використанням наступного виразу: . Базове полутонове зображення І розглядається як функція двох змінних з початком в координатах в місті центрального піксела зображення в піксельній системі координат.
1.2.4 Зворотнє перетворення Радона Функція І = irandom ( P , theta ) здійснює зворотне перетворення Радона [4, 8] і реконструює зображення І по його матриці проекцій Р . Якщо theta – вектор, то він повинен містити кути в градусах, що монотонно збільшуються з однаковим кроком d _ theta і задають напрямок осей, проекції яких знаходяться в матриці Р . Якщо theta – скаляр, що задається як d _ theta , то кути проекцій розраховуються як theta = m * d _ theta , де m =0,1,2,…, size ( P ,2)-1 . Функція І = irandom ( P , theta , interp , filter , d , n ) дозволяє задати чотири додаткових параметри: 1) interp – задає тип інтерполяції(лінійна, сплайнова, по найближчому відліку): 2) filter – задає тип фільтра: 3) d – число в діапазоні [0,1], що задає нормалізовану частоту; 4) n – кількість стовпчиків і рядків у відновленому зображенні; Всі вхідні і вихідні параметри повинні бути класу double . Методи розпізнавання рукописних символів, що розглядатимуться далі, історично являються ранніми. Вони передбачають попередню детальну обробку зображень, що розпізнаються. На основі такої обробки виділяють найбільш характерні особливості зображень для їх класифікації. Потім ці особливості перетворюються в коди, зручні для введення в систему розпізнавання. Так як опис зображень формується з врахуванням конкретної задачі, системи розпізнавання такого типу є непридатні, коли якісно змінюється множина зображень, які необхідно класифікувати, а також коли класифікація набуває новий зміст. В такого типу системах практично відсутнє навчання, так як всі її параметри відразу жорстко задаються конструктором.
Дипломные работы по информатикеМета роботи – розробити інформаційне та програмне забезпечення системи розпізнавання рукописних символів. Методи дослідження –
Оценок: 469 (Средняя 5 из 5)
Наверняка у вас есть товары или услуги, продажа которых приносит вам максимальную прибыль. Для быстрого старта в сети вам необходимо создание посадочной страницы (одностраничного сайта), на которой будет размещена информация о маржинальных товарах/услугах интернет магазина. За 8 лет опыта разработки конверсионных страниц мы выработали оптимальную структуру, которая позволит привлекать через landing page больше продаж. На такую структуру «одевается» ваш контент — фирменный стиль, тексты, фотографии, уникальные торговые предложения, после чего страница выходит в свет. Разработка лендинга и запуск в сети — до 7 рабочих дней. Стоит отметить, что в разработку самой посадочной страницы входит и написание копирайтером продающих текстов для вашего бизнеса, чтобы каждый посетитель страницы захотел совершить покупку именно у вас. Результат: качественно разработаная продающая посадочная страница, которая готова приносить вам новых клиентов.