このページでは、ウェブ上のニュースサイトに掲載されている記事を対象に、日本語記事が掲載されているウェブページと、その翻訳元となっている英語記事ウェブページのURLの組を収集したデータベースを無償で公開しています。
本データは日英パラレルコーパスとして使用することができます。ただし、ここでは対訳関係にあるウェブページのURLのみを公開しています。パラレルコーパスとして使用する際には、利用者自身でウェブページをダウンロードしたり、ページから記事本文を取得する作業を行う必要があります。ウェブから取得したデータを取り扱う際には著作権に十分に御配慮下さい。
詳細は本データのReadmeを御覧下さい。
(2012年3月7日版) CNET Japan 7759記事対 4618記事対 WIRED.jp 14098記事対 729記事対 EICネット 1739記事対 2761記事対 ニュースで英会話(NHK) 950記事対 688記事対 ABCニュースシャワー(NHK) 444記事対 214記事対
言語情報処理ポータル管理人: