JPXからのお知らせ

2020/09/16 JPX東証 東証適時開示コーパス提供サービスの開始について

 

株式会社東京証券取引所では、上場会社の英文開示資料の配信拡大や利用拡大を目的として、適時開示資料から作成したコーパスデータ(以下、「東証適時開示コーパス」という。)について、有償でのサービス提供(以下、「本サービス」という。)を、本年9月16日から行うことといたしました。
コーパスとは自然言語の文章を集積してデータ化したもので、自然言語処理の研究等に用いられており、近年では特に機械翻訳において利用されているものです。
東証適時開示コーパスの利用を通じて、上場会社や翻訳会社による英文開示資料作成の効率化・高度化による情報配信の強化や、海外投資家による機械翻訳を活用した適時開示資料等の利用拡大につながることを期待しています。

提供データ概要

本サービスで「東証適時開示コーパス」として提供されるデータは以下のとおりです。

データ名称 概要
適時開示資料モノリンガルコーパス(日・英) 特定期間中の適時開示資料等(PDF形式)から機械的にテキストを抽出して構築した、日本語と英語のそれぞれのコーパス
適時開示資料対訳コーパス(日英) 上述の適時開示資料モノリンガルコーパスをもとに構築した、日英の対訳コーパス
対訳コーパス1年分
+モノリンガルコーパスファイル対
上述の適時開示資料対訳コーパス(日英)と、同コーパスを構築する元となった適時開示資料をテキスト抽出した日英ファイル(モノリンガルコーパス)のセット

提供環境概要

当社は、Amazon Web Servicesの提供するパブリッククラウド環境上のバケットに「東証適時開示コーパス」をアップロードします。お客様は、当社から付与されたアクセスキーID等を使用して、バケットからご希望のデータをインターネット経由でダウンロードし利用することが可能です。

料金・お申込み方法

(本サービスは2022年に提供を停止しました)

 

利用開始手続き、契約及び請求に関するお問合せ

株式会社東京証券取引所 情報サービス部 サービス企画グループ
E-mail:inf_dev@jpx.co.jp


東証適時開示コーパスデータ及び「東証適時開示コーパス提供サービス サービスガイド」に関するお問合せ

株式会社JPX総研 フロンティア戦略部
E-mail:jpx-fintech@jpx.co.jp