Please use this identifier to cite or link to this item: https://scholar.dlu.edu.vn/handle/123456789/2042
DC FieldValueLanguage
dc.contributor.authorLa, Quốc Thắngen_US
dc.contributor.authorĐoàn, Minh Khuêen_US
dc.contributor.authorNguyễn, Thị Lươngen_US
dc.contributor.authorTrần, Ngô Như Khánhen_US
dc.contributor.authorHoàng, Minh Tiếnen_US
dc.date.accessioned2023-04-24T09:31:38Z-
dc.date.available2023-04-24T09:31:38Z-
dc.date.issued2022-07-
dc.identifier.urihttps://scholar.dlu.edu.vn/handle/123456789/2042-
dc.description.abstractNgữ liệu song ngữ là dữ liệu văn bản của hai ngôn ngữ được dịch tương ứng 1-1 về mặt ngữ nghĩa. Đây là nguồn dữ liệu hữu ích trong xử lý ngôn ngữ tự nhiên, đặc biệt là dịch máy thống kê. Do sự giới hạn của kích thước nguồn dữ liệu từ điển mà cần thiết phải mở rộng được từ điển bằng cách thu thập thêm các nguồn dữ liệu khác. Nghiên cứu này giới thiệu một quy trình xử lý và tổng hợp dữ liệu từ điển Việt - K'Ho từ nhiều nguồn khác nhau sử dụng phương pháp gióng từ trên văn bản song ngữ nhằm trích xuất các cặp từ song ngữ có mối quan hệ dịch. Kết quả thực nghiệm cho thấy chương trình gióng từ dựa trên mô hình IBM hiệu quả hơn chương trình dựa trên mô hình BERT với thời gian thực thi nhanh hơn.en_US
dc.language.isovien_US
dc.relation.ispartofHội thảo Khoa học Quốc gia về Công nghệ thông tin và Ứng dụng trong các lĩnh vực lần thứ 11 (CITA-2022);en_US
dc.subjectGióng câuen_US
dc.subjectGióng từen_US
dc.subjectMô hình BERTen_US
dc.subjectMô hình IBMen_US
dc.subjectSong ngữen_US
dc.subjectTách câuen_US
dc.subjectTách từen_US
dc.titleXây dựng ngữ liệu song ngữ Việt - K'Hoen_US
dc.typeConference paperen_US
dc.identifier.urlhttp://elib.vku.udn.vn/handle/123456789/2307en_US
dc.description.pages201-210en_US
dc.type.reportBài báo đăng trên KYHT trong nước (có ISBN)en_US
dc.description.departmentKhoa Công nghệ Thông tinen_US
dc.description.totalauthors5en_US
dc.description.paymentauthorLa Quốc Thắngen_US
dc.description.typejournaleXen_US
item.fulltextWith Fulltext-
item.languageiso639-1other-
item.grantfulltextrestricted-
crisitem.author.deptFaculty of Information Technology-
crisitem.author.deptFaculty of Information Technology-
crisitem.author.deptFaculty of Information Technology-
crisitem.author.deptFaculty of Information Technology-
crisitem.author.deptFaculty of Mathematics and Computer Science-
crisitem.author.orcid0000-0001-8550-7609-
crisitem.author.orcidhttps://orcid.org/0000-0002-7185-0147-
crisitem.author.parentorgDalat University-
crisitem.author.parentorgDalat University-
crisitem.author.parentorgDalat University-
crisitem.author.parentorgDalat University-
crisitem.author.parentorgDalat University-
Appears in Collections:Kỷ yếu hội thảo (Khoa Công nghệ thông tin)
Files in This Item:
File Description SizeFormat Existing users please Login
CITA2022 - Bilingual Corpora - v4.pdf1.08 MBAdobe PDF
Show simple item record


CORE Recommender

Page view(s)

146
Last Week
3
Last month
checked on Apr 1, 2026

Download(s)

114
checked on Apr 1, 2026

Google ScholarTM

Check




Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.