Xác định câu so sánh trong tài liệu văn bản tiếng Anh

Những năm gần đây, những nghiên cứu của miền ứng dụng xử lý ngôn ngữ tự nhiên (NPL – Natural Language Processing) ngày càng phát triển đã hỗ trợ rất đắc lực cho con người trong việc xác định và trích xuất ra dữ liệu cần thiết từ kho dữ liệu các trang Web của hàng ngàn, hàng vạn bài báo, đánh giá… mà chúng ta không thể trực tiếp thực hiện được. Việc trích xuất dữ liệu một cách chính xác tạo tạo tiền đề phát triển cho rất nhiều ứng dụng phân tích quan điểm.

Trong môi trường kinh doanh, khi bất cứ một sản phẩm mới nào được đưa ra thị trường, nhà sản xuất luôn muốn biết quan điểm của người tiêu dùng về sản phẩm của họ, cũng như sự so sánh sản phẩm đó với sản phẩm của những đối thủ cạnh tranh. Trong thời đại bùng nổ thông tin như hiện nay, hầu hết các thông tin này đều sẵn có trên các trang Web dưới dạng các bài tin tức, đánh giá của khách hàng, thảo luận trên các diễn đàn, mạng xã hội, …Việc trích xuất được những thông tin này hết sức quan trọng cho những nhà kinh doanh trong việc đưa ra các kế hoạch tiếp thị cũng như đánh giá tính hiệu quả của sản phẩm trên thị trường. Bên cạnh đó, việc so sánh cũng rất hữu ích cho chính các khách hàng tiềm năng của họ, nó giúp các khách hàng đưa ra các quyết định mua hàng sáng suốt hơn. Qua đây ta thấy việc so sánh là một trong những cách đánh giá thuyết phục nhất đối với một mặt hàng nói riêng và các đối tượng nói chung.

Câu so sánh có liên quan đến sự thể hiện quan điểm trực tiếp nhưng cũng có nhiều điểm khác biệt. Đó là, câu so sánh thường diễn tả quan điểm về hai hay nhiều thực thể dựa trên các đặc trưng hay thuộc tính giống nhau giữa chúng. Câu thể hiện quan điểm trực tiếp thông dụng hơn nhưng câu so sánh cũng được sử dụng khá rộng rãi, chiếm tỷ lệ 10% trong các văn bản thể hiện quan điểm do người dùng tạo ra trên Web. Việc xác định câu so sánh là bước tiền xử lý quan trọng, tạo tiền đề cho việc phát triển các lĩnh vực phân tích quan điểm khác trong mảng khai phá so sánh.

Hiện nay trên thế giới đã có nhiều công trình do các nhà nghiên cứu tiến hành để giải quyết bài toán khai phá so sánh trong các ngôn ngữ khác nhau. Trong luận văn này, chúng tôi sử dụng phương pháp học máy kết hợp với luật tuần tự phân lớp để giải quyết bài toán “Xác định câu so sánh trong tài liệu văn bản tiếng Anh”. Qua đó đưa ra đánh giá về phương pháp đã nghiên cứu cũng như định hướng mở rộng nghiên cứu dựa trên kết quả của luận văn này.

Bố cục luận văn gồm các chương như sau:

  • Chương 1: Tổng quan về phân tích quan điểm, tập trung giới thiệu tầm quan trọng của ứng dụng phân tích quan điểm, các nhiệm vụ chính, các bài toán áp dụng cùng các phương pháp giải quyết, trong đó có bài toán khai phá so sánh.
  • Chương 2: Khai phá câu so sánh, phân tích chi tiết về bài toán khai phá câu so sánh trong văn bản tiếng Anh cũng như phương pháp tiếp cận để giải quyết bài toán này.
  • Chương 3: Thực nghiệm, tóm lược kết quả cài đặt thực nghiệm cách tiếp cận đã trình bày ở chương 2 để giải quyết bài toán xác định câu so sánh trong văn bản tiếng Anh

Link tải tài liệu: https://tii.la/1LpCz2AuNy

Lưu ý: Link tải có chứa quảng cáo được rút gọn bằng Shrinkearn.com

Mật khẩu mở tệp PDF: sharetailieu.net

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Mới Nhất

Cùng Chuyên Mục

Đọc Nhiều Nhất