SEDAR FOX - CEDAR-FOX

Bu sud ekspertizasi uchun dasturiy tizim qo'l yozuvlarini taqqoslash. U ishlab chiqilgan SEDAR, Buffalo universiteti hujjatlarni tahlil qilish va tanib olish bo'yicha mukammallik markazi.[1][2][3] SEDAR FOX bilan o'zaro ishlash qobiliyatiga ega so'roq qilingan hujjat tekshiruvchisi skaner qilingan hujjatdan qiziqish mintaqalarini ajratib olish, matn satrlari va so'zlarini aniqlash, matn elementlarini tanib olish kabi bosqichlarni qayta ishlash. Yakuniy maqsad - prokuratura va mudofaa gipotezalari bo'yicha jurnalning yozilish ehtimoli koeffitsientini aniqlash uchun ikkita yozuv namunalarini taqqoslash. Bundan tashqari, imzo namunalarini taqqoslash uchun ham foydalanish mumkin. Qo'shma Shtatlar Patenti bilan himoyalangan dasturiy ta'minot [4] litsenziyasini Cedartech, Inc.

Tafsilotlar

Yozuvchini tekshirish - ikkita qo'lda yozilgan namunalarni bitta yozuvchi yozgan yoki yozmaganligini aniqlash vazifasi. U so'roq qilingan hujjat tekshiruvchisida qo'llaniladi. Ko'rsatkichlar to'plamidan foydalangan holda, CedarFox, ikkita hujjat bir xil shaxs tomonidan yoki har xil shaxslar tomonidan yozilganligiga qaramay, ishonch o'lchovini birlashtirishi mumkin. CedarFox taqqoslash uchun to'liq hujjatni yoki hujjatning ma'lum bir mintaqasini tanlashga imkon beradi. Taqqoslash so'l xususiyatlariga (qiya, bog'lanish va hokazo kabi global xususiyatlarni o'lchaydigan), mikro xususiyatlarga (ular individual belgilar shakllariga asoslangan) va uslub xususiyatlariga (masalan, belgilar juftliklari yoki bigramlar) asoslangan. Yozuvchini tekshirishning ikki xil uslubi mavjud: (i) so'roq qilingan hujjat ma'lum bo'lgan bitta hujjat bilan taqqoslanadi (ushbu taqqoslashning asosi odamning qancha o'zgarishi mumkinligiga asoslangan statistik ma'lumotlar) va (ii) so'roq qilingan hujjat taqqoslangan "bir nechta ma'lum" hujjatlarga qarshi. Bu erda tizim yozuvchining odatlari haqida ma'lum bo'lgan hujjatlardan o'rganadi. Ushbu rejimdan foydalanish uchun kamida to'rtta ma'lum hujjatlar mavjud bo'lishi kerak. Foydalanuvchini aniqlash vazifasi ikki qismga bo'lingan,

Hujjatlarni qayta ishlash va xususiyatlarni chiqarish

CEDAR-FOX hujjatda ularni taqqoslashga tayyor qilish uchun turli xil operatsiyalarni bajaradi. Ular pol chegarasini, satrlarni olib tashlashni, qatorlarni segmentatsiyalashni, so'zlarni segmentatsiyalashni va transkripsiyani xaritalashni o'z ichiga oladi.

Tasvir xususiyatini tahlil qiling.

Rasmga ishlov berish

  • Eshik chegarasi old pikselni fon pikselidan ajratish uchun kulrang shkaladagi rasmni ikkilikka o'zgartiradi. Otsu pol, Adaptiv pol va tekstura ostonasi ishlatiladi.
  • Agar hujjat qoidalar qog'ozi yordamida yozilgan bo'lsa, foydalanuvchi pastki chiziqni olib tashlash operatsiyasini bajarishi mumkin. Ushbu operatsiyani bajarish uchun Hough konvertatsiyasi qo'llaniladi va foydalanuvchi shu uchun to'g'ri chegarani tanlashi mumkin. Yuqori chegarani tanlash ba'zi bir belgi zarbalarini olib tashlashga olib keladi va foydalanuvchi chegara uchun to'g'ri qiymatni topishi kerak.
  • Chiziq segmentatsiyasi hujjatdagi har bir satrni ajratadi va Bi-Variate Gaussian Densities konsepsiyasidan foydalanadi. So'zlarni segmentatsiya qilish xuddi shunday ishlaydi va hujjat ichidagi har bir so'zni ajratib turadi.
    So'zlarni segmentatsiya qilish.
  • Transcriptni moslashtirish - bu dasturiy ta'minotga qo'lda yozilgan rasmning transkriptini o'z ichiga olgan matnli fayl taqdim etiladigan asosiy haqiqat. Bu turli xil sub'ektlardan bir xil tarkibni qo'lda yozish kerak bo'lganda va u noma'lum hujjat bilan mos kelganda foydalidir. Bu transkript va qo'lda yozilgan rasm o'rtasidagi eng yaxshi darajadagi moslikni topadi. Belgilarning rasmlari ajratib olinadi va ulardan hujjatning o'xshashligini solishtirish uchun foydalanish mumkin.

Tizim yordam dasturlari

CedarFox hujjatlarni to'g'ridan-to'g'ri skanerlash, shuningdek natijalarni to'g'ridan-to'g'ri varaqlarga kiritish va oraliq natijalarni chop etish uchun foydalanuvchi interfeyslariga ega. Hujjatlarning meta-ma'lumotlarini saqlash uchun ma'lumotlar bazasiga kirish imkoniyati mavjud.

Hujjatlarni taqqoslash

Hujjatlarni taqqoslash uchun CEDAR-FOX bilan ko'plab variantlar mavjud. Amaldagi to'rtta asosiy tekshirish modeli

  • Kamsituvchi elementlarni aniqlash.
Xususiyatlar Makro (global) va Micro (mahalliy) xususiyatlarga bo'linadi. Ibratli xususiyatlar butun hujjat bo'yicha, mikro xususiyatlar esa tanlangan belgilar / bi-gramm / so'zlar bo'yicha hisoblanadi. Ibratli xususiyatlar kulrang shkalaga asoslangan, konturga asoslangan, nishabga asoslangan, zarb kengligi, qiyalik, balandlik va bo'shliq. Ushbu xususiyatlar taqqoslash uchun ishlatiladi.
Hujjatlar xaritalarini xususiyatlar kosmosidan masofa oralig'iga solishtirish. Ibratli xususiyatlar haqiqiy qiymatga ega va shuning uchun masofani masofaga xaritalash ikki xususiyat o'rtasidagi mutlaq farqdir. Ikkilik qiymat uchun o'xshashlikni urish masofasi, evklid masofasi va boshqalar yordamida hisoblash mumkin. Korrelyatsion o'xshashlik o'lchovi eng yaxshi o'lchov sifatida tavsiya etiladi.
  • Pdf-dan foydalangan holda masofa makonini taqsimotini parametrli modellashtirish.
Masofaviy masofani taqsimlash Gauss yoki Gamma taqsimoti sifatida ifodalanadigan ehtimollik zichligi funktsiyasi yordamida modellashtirilgan. hujjatlar xarakteri mikro xususiyatlarga ta'sir qiladi, lekin makro xususiyatlarga ta'sir qilmaydi. Imkoniyatlar koeffitsienti (LR) va undan keyin Log ehtimolligi koeffitsienti (LLR) hisoblanadi.
  • Dalillarning 9 balli kuchini hisoblash.
LLR 9 balli sifatli shkalada xaritada ko'rsatilgan. Ushbu o'lchov LLR qiymati bilan bog'liq bo'lgan dalillarning kuchiga mos keladi. Bu ASTM texnologiyasidan 9 balli tizimga mos keladi. [1- Xuddi shunday aniqlandi, 2-Yuqori ehtimollik bilan, 3-Balki shunday qildi, 4-Ko'rsatkichlar amalga oshirildi, 5-Xulosa yo'q, 6-Indikatsiya qilmadi, 7-Ehtimol bo'lmagan, 8-Yuqori ehtimollik bilan topilmadi, 9-sifatida aniqlandi Yo'q qilish].

Qidirilmoqda

CedarFox-da qo'lda yozilgan hujjatlarni kalit so'zlar mavjudligini qidirish uchun bir nechta usul mavjud. So'zlarni aniqlash foydalanuvchiga so'zning rasmini so'rov sifatida tanlashga imkon beradi, bu esa ko'rsatilgan hujjatdagi o'xshash so'z tasvirlarini topish uchun ishlatiladi. Qidiruvning yana bir turi foydalanuvchiga hujjat (lar) dagi barcha so'zlarni saralash uchun ishlatiladigan so'zni kiritish imkoniyatini beradi.

Qo'lda yozishni aniqlash

CedarFox avtomatik belgilarni aniqlash qobiliyatiga ega. So'zni oldindan belgilangan leksikon bilan tanib olish ham o'rnatilgan. Yozuvchini tekshirish / identifikatsiyalash maqsadida belgilarni aniqlashning eng yuqori aniqligi talab qilinsa, foydalanuvchi belgilar identifikatorlarini qo'lda kiritishi mumkin.

Qo'l yozuvi namunalarini taqqoslash.

O'qish mumkinligi va o'qilishi tahlili

So'zlarni taqqoslash va Palmer metrikalari bilan taqqoslash qo'llab-quvvatlanadi.

Adabiyotlar

  1. ^ S. N. Srixari, C. Xuang va X.Srinivasan, "Egizaklar qo'lyozmasining kamsitilishi to'g'risida", Sud ekspertizasi jurnali Arxivlandi 2010-11-23 da Orqaga qaytish mashinasi , 2008 yil mart, jild 53 (2), 430-446 betlar
  2. ^ Srixari, S. N., S-H. Cha, X. Arora va S. Li, "Qo'l yozuvi individualligi",Sud ekspertizasi jurnali Arxivlandi 2010-11-23 da Orqaga qaytish mashinasi, 2002, 47(4): 856-872
  3. ^ S. N. Srixari, X.Srinivasan va K. Desai, "SEDAR-FOX yordamida savolli hujjatlarni tekshirish".Sud hujjatlari ekspertizasi jurnali, 18, 2007, 1-20 betlar
  4. ^ S. N. Srixari va boshqalar, Qo'lda yozilgan yoki biometrik namunalarni tahlil qilish va / yoki taqqoslash usuli va apparati, Amerika Qo'shma Shtatlarining patent raqami 7.580.551, 29.2009 y.

Tashqi havolalar