Thai Web Corpus (TWC) เป็นคลังข้อมูลภาษาไทยในเว็บสำหรับผู้เรียนภาษาไทย(และนักวิชาการ)
ผู้ใช้บริการสามารถสืบค้นจากคลังข้อมูลได้หลายแบบ เช่น ตัวอย่างประโยคพร้อมด้วยบริบท หรือคำที่มักจะปรากฏร่วม
เนื่องจากคลังข้อมูลเป็น "ชุดข้อมูลของการใช้งานจริง" จึงอาจมีภาษาไทยที่ไม่มาตรฐานด้วย
หากต้องการใช้คลังข้อมูลที่มีจำนวนข้อมูลและฟังก์ชันจำนวนมาก แนะนำให้ใช้
Thai National Corpus (TNC)
แอปพลิเคชันนี้สร้างโดย Python3.7 (Flask), JavaScript, MySQL8.0 และใช้
PyThaiNLP ในการตัดคำ
Thai Web Corpus (TWC) はタイ語学習者向けに作られたタイ語のウェブコーパス(言語使用記録集)です。
実際にどのような文脈で用いるか、どのような単語と一緒になりやすいかなどを、コーパスに基づいて確認することが可能です。
ただし、あくまで「ウェブ上での生の言語使用記録」であり、辞書のような「標準的タイ語」だけとは限らないという点をご了承下さい。
より高機能かつ幅広いデータソースのタイ語コーパスとして
Thai National Corpus (TNC) もありますので、こちらもご利用下さい。
このアプリケーションは Python3.7 (Flask), JavaScript, MySQL8.0 で開発されています。形態素解析には
PyThaiNLP を使用しています。