JPXからのお知らせ

2020/04/16 東証 東証適時開示コーパスに関する限定公開実証実験の実施について

 

株式会社東京証券取引所(以下「東証」)は、適時開示資料等から作成したコーパスデータに関する限定公開実証実験(以下、「本PoC」)を実施いたします。
コーパスとは自然言語の文章を集積してデータ化したもので、自然言語処理の研究等に用いられており、近年では特に機械翻訳において利用されているものです。
本PoCでは、適時開示資料等から作成した対訳コーパス及びモノリンガル・コーパスをサンプル提供し、当該データの利活用の可能性について、本PoC参加者からのフィードバックを受けながら検証します。
本PoCの結果を踏まえて、当該データの外部配信について検討します。

提供データ概要

名称 データ概要
適時開示資料
モノリンガル・コーパス
(日・英)
特定期間中の開示資料等(PDF形式)から機械的にテキストを抽出して構築した、日本語と英語のそれぞれのコーパス
適時開示資料
対訳コーパス
(日・英)
上述の適時開示資料モノリンガル・コーパスをもとに構築した、日英の対訳コーパス
  • データの期間は2019年開示分です。

実証実験の参加申込方法

本PoCの参加者は、東証及び株式会社大阪取引所の取引参加者、株式会社日本証券クリアリング機構の清算参加者並びにその他東証が適当と認めた法人とします。
本PoCへの参加にあたっては、東証が運営する証券データの利活用に向けた実証実験プログラム及び本PoCへの参加申込が必要です。お申し込みにつきましては、以下までお問い合わせください。

(本PoCは2022年に終了しました。)

お問合せ

株式会社東京証券取引所  情報サービス部 サービス企画グループ
電話:03-3666-0141(代表)
E-mail:inf_dev@jpx.co.jp