Avatar
0
hurmcuuxqeu47e6u Beginner
Trích xuất dữ liệu trên CCCD không gắn chip
Hiện tại mình đang làm về trích xuất dữ liệu trên căn cước công dân , trong hướng dẫn https://viblo.asia/p/trich-xuat-thong-tin-tu-chung-minh-thu-bJzKmaRwK9N?fbclid=IwAR3TJrh43NOvV4_70rEnOaUch3W8aRGIKEx9MNqSSFcbnSylCxPbiiSQ1dU#_21-detect-4-goc-chung-minh-thu-2 , có hướng dẫn Detect 4 góc căn cước, mình chưa hiểu về đoạn " sử dụng mô hình của bản thân ,với mô hình detect đã được cung cấn sẵn bởi Tensorflow API" nhờ bạn hướng dẫn giúp ạ. Dưới đây là code import trực tiếp thừ file mình chụp

import cv2

import pytesseract

def extract_id_card_info(image_path):

image = cv2.imread(image_path)

gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

Vùng chứa Số CCCD

number_roi = image[210:270, 500:960]

number_text = extract_text_from_image(number_roi)

print("Số CCCD:", number_text)

Vùng chứa tên

name_roi = image[290:350, 520:1000]

name_text = extract_text_from_image(name_roi)

print("Tên:", name_text)

Vùng chứa ngày sinh

birthdate_roi = image[350:430, 665:900]

birthdate_text = extract_text_from_image(birthdate_roi)

print("Ngày sinh:", birthdate_text)

Vùng chứa giới tính

gender_roi = image[435:480, 490:660]

gender_text = extract_text_from_image(gender_roi)

print("Giới tính:", gender_text)

Vùng chứa quốc tịch

nationality_roi = image[435:480, 790:1000]

nationality_text = extract_text_from_image(nationality_roi)

print("Quốc tịch:", nationality_text)

Vùng chứa quê quán

hometown_roi = image[490:545, 520:1200]hometown_text = extract_text_from_image(hometown_roi)

print("Quê quán:", hometown_text)

Vùng chứa nơi cư trú

address_roi = image[575:635, 565:1200]

address_text = extract_text_from_image(address_roi)

print("Nơi cư trú:", address_text)

Vùng chứa ngày hết hạn

expiration_date_roi = image[655:705, 220:410]

expiration_date_text = extract_text_from_image(expiration_date_roi)

print("Ngày hết hạn:", expiration_date_text)

def extract_text_from_image(image):

gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

text = pytesseract.image_to_string(gray, lang='vie+eng')

return text

image_path = r"C:UsersadminDesktopcccm1.jpg"

extract_id_card_info(image_path)

  • Answer
Remain: 5
1 Answer
Avatar
Vu Luong Anh Beginner
Mình nghĩ ý tác giả ở đây là bạn ấy tự xây dựng bộ dữ liệu với 4 nhãn là bottom left, bottom right, top left, top right. Xong sẽ dùng tensorflow để huấn luyện mô hình detect 4 góc trên bộ dữ liệu đấy.

Tức là mô hình object detection đã có sẵn của tensorflow, còn bộ dữ liệu thì tác giả tự xây dựng để huấn luyện mô hình.

  • 0
  • Reply