dbo:abstract
|
- Az optikai karakterfelismerés vagy az optikai karakterolvasó, amelyet gyakran rövidítettek OCR-ként, a gépelt, kézzel írt vagy nyomtatott szövegek gépi kódolású, mechanikus vagy elektronikus átalakítása, akár beolvasott dokumentumból, akár egy dokumentum fotójából, egy jelenetfotóból (például a tájképen lévő jelzéseken és hirdetőtáblákon található szöveg), vagy a feliratú szöveg egy képben (például egy televíziós műsorból) . Széles körben használják a nyomtatott papíradatbázisok információs bejegyzését - legyen az útlevél, számlák, bankszámlakivonatok, számítógépes bevételek, névjegykártyák, levelek, statikus adatok kinyomtatása vagy bármilyen megfelelő dokumentáció - ez a nyomtatás általános digitalizálásának módja. szövegeket úgy, hogy azok elektronikusan szerkeszthetők, kereshetők, kompaktabban tárolhatók legyenek, megjeleníthetők on-line módon, és olyan gépi folyamatokban használhatók, mint a , a gépi fordítás, a (kivont) szöveg-beszéd, kulcsadatok és szövegbányászat. Az OCR a , a mesterséges intelligencia és a számítógépes látás kutatási területe. A korai verziókat minden karakter képével kellett képezni, és egyszerre egy betűtípussal kellett dolgoznia. Jelenleg gyakoriak a fejlett rendszerek, amelyek nagyfokú felismerési pontosságot képesek előállítani a legtöbb betűtípus esetében, és számos digitális képfájlformátum bemenet támogatásával. Néhány rendszer képes formázott kimenet reprodukálására, amely szorosan közelíti az eredeti oldalt, beleértve a képeket, oszlopokat és más nem szöveges összetevőket is. (hu)
- Az optikai karakterfelismerés vagy az optikai karakterolvasó, amelyet gyakran rövidítettek OCR-ként, a gépelt, kézzel írt vagy nyomtatott szövegek gépi kódolású, mechanikus vagy elektronikus átalakítása, akár beolvasott dokumentumból, akár egy dokumentum fotójából, egy jelenetfotóból (például a tájképen lévő jelzéseken és hirdetőtáblákon található szöveg), vagy a feliratú szöveg egy képben (például egy televíziós műsorból) . Széles körben használják a nyomtatott papíradatbázisok információs bejegyzését - legyen az útlevél, számlák, bankszámlakivonatok, számítógépes bevételek, névjegykártyák, levelek, statikus adatok kinyomtatása vagy bármilyen megfelelő dokumentáció - ez a nyomtatás általános digitalizálásának módja. szövegeket úgy, hogy azok elektronikusan szerkeszthetők, kereshetők, kompaktabban tárolhatók legyenek, megjeleníthetők on-line módon, és olyan gépi folyamatokban használhatók, mint a , a gépi fordítás, a (kivont) szöveg-beszéd, kulcsadatok és szövegbányászat. Az OCR a , a mesterséges intelligencia és a számítógépes látás kutatási területe. A korai verziókat minden karakter képével kellett képezni, és egyszerre egy betűtípussal kellett dolgoznia. Jelenleg gyakoriak a fejlett rendszerek, amelyek nagyfokú felismerési pontosságot képesek előállítani a legtöbb betűtípus esetében, és számos digitális képfájlformátum bemenet támogatásával. Néhány rendszer képes formázott kimenet reprodukálására, amely szorosan közelíti az eredeti oldalt, beleértve a képeket, oszlopokat és más nem szöveges összetevőket is. (hu)
|