หนึ่งในความท้าทายที่หลายธุรกิจกำลังเผชิญคือ การใช้เวลาและทรัพยากรบุคคลจำนวนมากไปกับการจัดการงานเอกสารซึ่งเป็นส่วนงานที่กินเวลามากที่สุด
ยกตัวอย่างธุรกิจธนาคารในแผนกสินเชื่อ พวกเขาต้องใช้เวลา 20-30% ของเวลาทำงานทั้งหมดไปกับการจัดการเอกสาร เช่น การตรวจสอบและอนุมัติสินเชื่อ ไหนจะต้องกรอกข้อมูล ตรวจสอบความถูกต้องอีกครั้งและอีกครั้ง
จากรายงานของ Gartner ยังพบว่า องค์กรสูญเสียเงินโดยเฉลี่ยถึง 15 ล้านดอลลาร์สหรัฐต่อปี หรือราว ๆ 500 ล้านบาท ไปกับความเสี่ยงต่อข้อผิดพลาดของมนุษย์ (Human error)
ถ้าเอาจำนวนเวลาที่เสียไปกับการจัดการงานเอกสารที่ท่วมท้นรวมกับจำนวนเงินที่เสี่ยงจะสูญเสียหากเกิดความผิดพลาดจากการคีย์ข้อมูลผิดเพราะความเหนื่อยล้าของพนักงาน บวกลบคูณหารอย่างไรก็มีแต่เสียกับเสีย
Pain Point ที่กล่าวมาจึงส่งให้ AI เข้ามาเป็นตัวเปลี่ยนเกม โดยเฉพาะ OCR (Optical Character Recognition) ซึ่งเป็นเทคโนโลยี AI ที่ช่วยแปลงข้อความเอกสารให้อยู่ในรูปแบบของข้อความดิจิทัล ซึ่งไม่เพียงช่วยให้งานเอกสารกลายเป็นเรื่องง่าย ลดภาระงาน แต่ยังช่วยลดต้นทุนในระยะยาวและสร้างมูลค่าเพิ่มให้กับธุรกิจ
ในสหรัฐอเมริกาธุรกิจที่นำ OCR ไปใช้มากที่สุด ได้แก่ กลุ่มธนาคาร (Banking), การบริการทางการเงิน (Financial Services) และกลุ่มธุรกิจประกันภัย (Insurance) และมีแนวโน้มว่ากลุ่มธุรกิจอื่นๆ ที่ต้องใช้กำลังคนและทรัพยากรเวลาไปกับงานเอกสารจำนวนมหาศาลจะเริ่มใช้ OCR ด้วยเช่นกัน
Grand View Research บริษัทวิจัยด้านการตลาดของสหรัฐฯ ยังคาดการณ์ว่า ตลาดของเทคโนโลยี OCR จะเติบโตเฉลี่ยต่อปี (CAGR) อยู่ที่ 13.7% และมีแนวโน้มจะมีมูลค่าถึง 25.6 พันล้านดอลลาร์ภายในปี 2027
สำหรับประเทศไทย OCR เริ่มมีการใช้ในกลุ่มธุรกิจธนาคารและกลุ่มธุรกิจประกันภัยมาสักระยะ ทำงานด้วยการใช้ AI อ่านภาพหรือสแกนเอกสารที่เป็นตัวอักษร จากนั้นจะแปลงข้อมูลทั้งหมดให้กลายเป็นข้อความดิจิทัล ซึ่งสามารถแก้ไข ค้นหาและจัดเก็บในคอมพิวเตอร์ได้อย่างเป็นระบบ
แต่ปัจจุบันเทคโนโลยี OCR มีการพัฒนาให้สามารถอ่านลายมือภาษาไทยได้ ภายใต้โปรแกรม OCR by WordSense (บริษัท เวิร์ดเซนส์ จำกัด) ซึ่งเป็นบริษัทในเครือ ลูลู่ เทคโนโลยี จำกัด (Looloo Technology) สตาร์ทอัพไทยที่ทำธุรกิจที่ปรึกษาและเป็นผู้เชี่ยวชาญด้าน AI ที่มีชื่อเสียงในการเพิ่มประสิทธิภาพ รายได้ และกำไรให้ลูกค้า โดยมุ่งเน้นปรับแต่งโซลูชัน อาทิ การวิเคราะห์เชิงคาดการณ์ (Predictive Analytics), การประมวลผลภาษาธรรมชาติ (Natural Language Processing), การประมวลผลเอกสารอัจฉริยะ (Optical Character Recognition) และการแปลงเสียงเป็นข้อความ (Speech-to-Text) ให้ตรงตามความต้องการของผู้ใช้งาน
OCR by WordSense ถือเป็นเจ้าแรกในตลาด OCR ของไทยที่มี ‘OCR Handwriting’ โปรแกรมที่สามารถแปลงลายมือภาษาไทยเป็นข้อความดิจิทัล ได้ความแม่นยำตั้งต้น Average Accuracy Rate 92% และความแม่นยำตั้งต้นในการแปลงตัวพิมพ์ภาษาไทยเป็นข้อความดิจิทัล OCR Typed 95%
สหพัฒณ์ ล้ำสมบัติ CEO บริษัท เวิร์ดเซนส์ จำกัด บอกว่า “ความแม่นยำของ OCR by WordSense ไม่ได้หยุดอยู่ที่ตัวเลขนี้ เพราะยิ่งใช้งาน OCR ระบบจะสามารถพัฒนาขึ้นเรื่อยๆ ในโปรเจกต์นั้นๆ”
จาก OCR สู่ OCR Handwriting
“บริษัท ลูลู่ เทคโนโลยี จำกัด เรามีพันธกิจที่ต้องการทำในสิ่งที่ยังไม่มีใครทำได้ ในยุคแรกเรายังไม่มีโปรดักต์เป็นของตัวเองแต่จะเป็นการปรับแต่งและพัฒนาโปรดักต์ให้กับลูกค้า ซึ่งโปรเจกต์ที่ทำให้เกิด ‘OCR Handwriting’ เกิดจากการพัฒนา AI ให้กับบริษัทโลจิสติกส์ยักษ์ใหญ่แห่งหนึ่งของไทย ตอนนั้นเราได้รับโจทย์ว่าต้องการ AI ที่สามารถอ่านลายมือบนพัสดุและซองจดหมายได้”
สหพัฒณ์ บอกว่า โปรเจกต์นี้ทำให้บริษัทมีคลังข้อมูลภาพจำนวนมหาศาลในการเทรน AI และกลายเป็นข้อได้เปรียบที่เหนือกว่าคู่แข่งในตลาด OCR
“ถือเป็นโจทย์ที่ท้าทายมาก เพราะการจะเทรน AI ให้อ่านลายมือภาษาไทยที่มีความซับซ้อนได้ต้องใช้รูปภาพหลักล้านรูป แต่เราไม่มีรูปภาพเยอะขนาดนั้น ช่วงแรกเราจึงสร้าง AI ขึ้นมาอีกตัวเพื่อเรียนรู้และฝึกเขียนลายมือภาษาไทยจากฐานข้อมูลลายมือที่มีอยู่ เพื่อเพิ่มข้อมูลลายมือให้มากขึ้น แต่ภาษาไทยมีความซับซ้อนและลายมือของคนก็ไม่มีรูปแบบที่ไม่จำกัด คาดเดาไม่ได้”
สหพัฒณ์ ยกตัวอย่าง ด. เด็ก กับ ต.เต่า ที่เขียนด้วยลายมือบางครั้งแยกแทบไม่ได้ ยังมีเรื่องของสระและวรรณยุกต์ หรือสระจากบรรทัดบนชนกับวรรณยุกต์บรรทัดล่าง ไหนจะการสะกดคำของวัยรุ่น ไปจนถึงชื่อและนามสกุลที่เขียนตัวสะกดต่างกัน
“สุดท้ายเราเลือกที่จะเอา NLP (Natural Language Processing) เข้ามาเพื่อทำช่วยความเข้าใจภาษามนุษย์มากขึ้น ไม่ใช่แค่อ่านแต่จะอ่านพร้อมความเข้าใจให้เหมือนมนุษย์”
สหพัฒณ์ ยกตัวอย่างกรณีที่สแกนหรือถ่ายภาพมาไม่ชัด ไม่ชัวร์ว่า คำที่เห็นคือ ‘กาศ’ หรือ ‘กาด’ สิ่งที่ NLP เข้ามาช่วยคือ ดูบริบทของคำที่อยู่ข้างหน้า ถ้าคำข้างหน้าเป็นคำว่า ‘ประ’ มันจะประมวลผลมาเป็นคำว่า ‘ประกาศ’ แต่ถ้าข้างหน้าเป็นคำว่า ‘ผัก’ ผลลัพธ์ที่ได้คือคำว่า ‘ผักกาด’
แต่การใช้ NLP ก็ยังมีข้อจำกัดบางอย่าง เช่น ชื่อและนามสกุลที่ใช้ตัวสะกดต่างกัน “เดี๋ยวนี้จะเห็นชื่อคนที่เขียนด้วยสะกดแปลกๆ เช่น สมชาย กับ ศมชาย ถ้าเจอคำนี้ OCR จะอ่านเป็น สมชาย เพราะเคยชินกับคำนั้นมากกว่า ต้องยอมรับว่านี่คือจุดอ่อนของระบบ สิ่งที่เราแก้ปัญหาก็คือ ถ้าแบบฟอร์มมีชื่อและนามสกุล ไม่ต้องใช้ NLP เข้ามาช่วยให้อ่านดิบๆ ไปเลย” สหพัฒณ์กล่าว
แม้จะมีจุดอ่อน…แต่ปัจจุบัน OCR by WordSense ก็ยังเป็นเจ้าเดียวที่อ่านลายมือภาษาไทยเป็นข้อความดิจิทัลได้ และอย่างที่สหพัฒณ์บอกยิ่งใช้งานบ่อยความแม่นยำยิ่งเพิ่มมากขึ้น
สร้างประสบการณ์การใช้งานที่ไร้รอยต่อ
จะเรียกว่าเป็นข้อได้เปรียบก็ไม่ผิด ด้วยความที่ OCR by WordSense เติบโตมาจากการเป็นผู้เชี่ยวชาญด้าน Customize Solution ทำให้เข้าใจ Pain Point ของผู้ใช้งานเป็นอย่างดี
สหพัฒณ์เล่าว่า ไอเดียตั้งต้นคือการสร้างโปรแกรม OCR ให้เป็นเหมือนแอปพลิเคชันหนึ่งตัว แต่ตอนทดสอบระบบและให้ลูกค้าทดลองใช้ก็พบปัญหาใหม่
“ลูกค้าไม่ใช้ ไม่ใช่เพราะ OCR ไม่ดี แต่เพราะเราลืมนึกไปว่า เรากำลังเพิ่มขั้นตอนการทำงานให้กับเขา เราจึงตัดสินใจพัฒนา OCR ให้เป็นโซลูชันที่สามารถเชื่อมกับระบบเดิม ไม่ว่าจะเป็นระบบภายในของบริษัทนั้นๆ หรือ เชื่อมกับแอปฯ ของบริษัท ข้อดีคือ คนที่ใช้งานแทบไม่รู้สึกเลยว่ามีการเปลี่ยนแปลง”
“เช่น ลูกค้าอยากให้เราเชื่อม OCR เข้ากับ LINE OA เวลาลูกค้าของเขาส่งเอกสารผ่าน LINE OA ระบบ OCR จะอ่านดูก่อนว่าเอกสารที่ส่งมาเป็นเอกสารประเภทไหน แล้วจึงอ่านและประมวลผล”
เรื่องที่ตามมาจากการบูรณาการ OCR กับระบบเดิมของลูกค้าคือเรื่องความปลอดภัยและการรักษาความลับของข้อมูล สหพัฒณ์ บอกว่า ทุกครั้งที่เริ่มโปรเจกต์จะมีการเซ็น NDA นอกจากจะมีการมีการเข้ารหัสทั้งกระบวนการตั้งแต่ต้นจนจบแล้ว ข้อมูลทั้งหมดของลูกค้าจะถูกจัดเก็บไว้ใน AWS Cloud ซึ่งมีมาตรการรักษาความปลอดภัยที่ทันสมัยและรัดกุม ได้รับการรับรอง ISO27001 มาตรฐานการจัดการความมั่นคงปลอดภัยสารสนเทศระดับโลก
“จุดแข็งของเราคือปรับแต่งโซลูชันให้ตรงตามความต้องการของลูกค้า ดังนั้น เวลาเราเทรนข้อมูลของลูกค้า จะไม่มีการนำข้อมูลมาเทรนรวมกันแม้ว่าลูกค้าจะมีโจทย์หรือความต้องการที่เหมือนกันก็ตาม”
ตัวอย่างการอ่านลายมือภาษาไทยของ Demo OCR by WordSense
ตัวอย่างการอ่านตัวพิมพ์ภาษาไทยของ Demo OCR by WordSense
นอกจากนี้ OCR by WordSense ยังสามารถจัดการกับเอกสารประเภท Semi Structure เช่น ใบเสร็จ ใบแจ้งหนี้ ที่มีรูปแบบต่างกันตามแต่ละบริษัทได้ “คำถามที่เราพบบ่อยคือ เอกสารของบริษัทมีแบบฟอร์มไม่เหมือนที่อื่น OCR ของเราจะอ่านได้มั้ย และนั่นคืออีกหนึ่งจุดเด่นของเราที่สามารถอ่านเอกสารสำคัญที่มีรูปแบบหลากหลายได้ โดยใช้หลักการเดียวกันกับการอ่านแบบดูบริบท อย่างใบเสร็จรับเงิน จะมีคีย์เวิร์ดหลักๆ เช่น เลขประจำตัวผู้เสียภาษี ชื่อผู้รับเงิน จำนวนสุทธิ ดังนั้นไม่ว่าจะใช้เอกสารจะมีฟอร์มแตกต่างกันก็สามารถอ่านและประมวลผลได้อย่างแม่นยำ” นั่นหมายความว่า ต่อให้องค์กรของคุณมีเอกสารที่ออกแบบฟอร์มมาเป็นพิเศษหรือเป็นฟอร์มเฉพาะของบริษัท WordSense สามารถปรับแต่ง OCR ที่ตอบโจทย์องค์กรของคุณได้อย่างไม่มีปัญหา
“จาก 30 คน เหลือแค่ 3 คน” OCR ในมิติของการลดต้นทุนแต่ไม่ลดประสิทธิภาพ
เพื่อให้เห็นภาพชัดขึ้นว่าการนำ OCR มาใช้ช่วยจัดการงานเอกสารจะลดต้นทุนในระยะยาวให้กับองค์กรได้อย่างไร และทำไมจึงเป็นเครื่องมือที่ช่วยเพิ่มโอกาสทางธุรกิจ สหพัฒณ์ บอกว่า สิ่งแรกคือ ‘ลดต้นทุนด้านบุคลากร’
“ปัจจุบันลูกค้าส่วนใหญ่ของเราเป็นลูกค้ากลุ่มธนาคารและประกันภัย โดยปกติจะใช้คนในการทำงานด้านเอกสาร 20-30 คน แต่หลังจากนำ OCR เข้ามาช่วยกระบวนการต่างๆ สามารถลดจำนวนพนักงานจากเดิม 30 คน ให้เหลือแค่ 3 คน ขณะเดียวกันมันยังช่วยลดเวลาการทำงาน จากเดิมที่ต้องใช้เวลากรอกเอกสารเป็นชั่วโมงก็เหลือไม่กี่นาที เมื่อลดภาระงาน เขาก็สามารถใช้ทักษะอื่นๆ ที่มีไปทำประโยชน์ได้มากกว่าการเสียเวลาไปกับงานเอกสาร”
มองการลงทุน AI เป็นการเล่นเกมยาว
“สุดท้ายคือเรื่องของการสร้างผลตอบแทนการลงทุน จริงอยู่ที่การลงทุนใน AI ไม่ได้สร้างผลประโยชน์ในปีแรก แต่ถ้ามองไปอีก 3-5 ปี มองเรื่องการขยายธุรกิจให้เติบโตโดยที่ไม่จำเป็นต้องเพิ่มบุคลากรหรือเพิ่มต้นทุนด้านการจัดการเอกสาร หรือจะมองเรื่องมูลค่าของ Data ซึ่งนั่นคือสินทรัพย์มูลค่ามหาศาลขององค์กรที่จะนำไปต่อยอดในอนาคต บริษัทที่สามารถใช้ข้อมูลอย่างมีประสิทธิภาพมีโอกาสเพิ่มผลกำไรได้มากกว่าเมื่อเทียบกับคู่แข่ง ดังนั้น อย่าตกหลุมพราง ROI ที่มองแค่ว่าลงทุนสิ่งนี้ต้องคืนทุนภายในกี่ปี ลูกค้าหลายรายที่มาคุยกับเราแต่สุดท้ายโปรเจกต์ไม่ได้ไปต่อเพราะติดหลุมพรางนี้ ผมว่าอีก 5 ปี หรือเร็วกว่านั้น AI จะเหมือนกับคอมพิวเตอร์ ทุกบริษัทต้องมี บริษัทที่ปฏิเสธจะถูกกลืนหายไปตามกาลเวลา”
สหพัฒณ์ บอกว่า ปัจจุบันนอกจากธุรกิจธนาคาร ธุรกิจประกันภัย เริ่มมีธุรกิจบริหารทรัพยากรบุคคลที่ดูแลข้อมูลให้กับบริษัทขนาดใหญ่หันมาใช้ OCR มากขึ้น รวมไปถึงธุรกิจด้านสุขภาพที่มาช่วยจัดเอกสาร เช่น ประวัติผู้ป่วย ผลแล็บ ใบสั่งยา
“ที่เซอร์ไพรส์มากคือกลุ่มบริษัท HR ที่ดูแลบริษัทมีการ Turn Over สูง ซึ่งเป็น Pain Point ของคนทำงานด้านนี้มาก บางทียังกรอกข้อมูลไม่เสร็จพนักงานลาออกแล้ว ดังนั้นอุตสาหกรรมไหนที่มีแบบฟอร์มต้องกรอกเยอะ ต้องเก็บข้อมูลจำนวนมากๆ OCR จะมีประโยชน์มาก”
“หน่วยงานภาครัฐก็เริ่มนำ OCR ของเราไปใช้ ส่วนหนึ่งน่าจะเกิดจากการที่เราสามารถพัฒนาและปรับแต่งโปรแกรมให้ตรงกับความต้องการได้เร็วขึ้น เนื่องจากเวลาที่ภาครัฐมีโปรเจกต์เขาต้องการโปรดักต์ที่พร้อมใช้งาน จากเดิมเราใช้เวลาในการวางระบบและพัฒนา 3-5 เดือน ตอนนี้กำลังพัฒนาให้สามารถ Implement ได้ภายใน 1 เดือน โดยมีระบบรักษาความปลอดภัยติดตั้งให้เรียบร้อย สามารถเลือกได้เลยว่าต้องการฟีเจอร์อะไร นำไปใช้งานแบบไหน”
สำหรับองค์กรหรือธุรกิจที่สนใจอยากจะนำ OCR หรือเทคโนโลยี AI อื่นๆ ไปใช้ สหพัฒณ์ แนะให้เริ่มด้วยการค้นหาว่าอะไรคือ Pain Point เร่งด่วน แล้วค่อยดูว่า AI ตัวไหนตอบโจทย์
“เรามีทีม Design Thinking ที่จะช่วยตั้งแต่ให้คำปรึกษาและออกแบบโซลูชันที่เหมาะกับแต่ละธุรกิจ หรือถ้าสนใจ OCR เรามีเวอร์ชันโมเดลให้ทดลองใช้ฟรี ไม่จำกัดขนาดข้อมูลและไม่เก็บข้อมูลระหว่างการทดลองใช้งาน แต่ถ้าจะลงทุนใน OCR แนะนำว่าควรจะเป็นธุรกิจที่มีปริมาณงานเอกสารต่อเดือนมากกว่า 50,000 ชิ้นถึงจะคุ้มทุน”
แต่ในอนาคตเราอาจได้เห็น WordSense พัฒนาเทคโนโลยีที่ช่วยจัดการงานเอกสารสำหรับองค์กรไซส์เล็กก็เป็นได้ ก็เหมือนกับพันธกิจของบ้านใหญ่ที่บอกว่า “ต้องการทำในสิ่งที่ยังไม่มีใครทำได้”
สนใจรับคำปรึกษาฟรี 3 ชั่วโมง ติดต่อเราวันนี้ โทร. 0 2028 7557
ฟรี! ทดลองใช้ Demo OCR by WordSense: wordsense-ocr-demo.loolootech.com
Website: https://loolootech.com
อ้างอิง: