{ "cells": [ { "cell_type": "markdown", "id": "identified-insert", "metadata": {}, "source": [ "#
\n", " | paragraph_ID | \n", "sentence_ID | \n", "token_ID_within_sentence | \n", "token_ID_within_document | \n", "word | \n", "lemma | \n", "byte_onset | \n", "byte_offset | \n", "POS_tag | \n", "fine_POS_tag | \n", "dependency_relation | \n", "syntactic_head_ID | \n", "event | \n", "
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "Mr. | \n", "Mr. | \n", "0 | \n", "3 | \n", "PROPN | \n", "NNP | \n", "nsubj | \n", "12 | \n", "O | \n", "
1 | \n", "0 | \n", "0 | \n", "1 | \n", "1 | \n", "and | \n", "and | \n", "4 | \n", "7 | \n", "CCONJ | \n", "CC | \n", "cc | \n", "0 | \n", "O | \n", "
2 | \n", "0 | \n", "0 | \n", "2 | \n", "2 | \n", "Mrs. | \n", "Mrs. | \n", "8 | \n", "12 | \n", "PROPN | \n", "NNP | \n", "compound | \n", "3 | \n", "O | \n", "
3 | \n", "0 | \n", "0 | \n", "3 | \n", "3 | \n", "Dursley | \n", "Dursley | \n", "13 | \n", "20 | \n", "PROPN | \n", "NNP | \n", "conj | \n", "0 | \n", "O | \n", "
4 | \n", "0 | \n", "0 | \n", "4 | \n", "4 | \n", ", | \n", ", | \n", "20 | \n", "21 | \n", "PUNCT | \n", ", | \n", "punct | \n", "0 | \n", "O | \n", "
... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
99251 | \n", "2995 | \n", "6885 | \n", "10 | \n", "99251 | \n", "Dudley | \n", "Dudley | \n", "438929 | \n", "438935 | \n", "PROPN | \n", "NNP | \n", "pobj | \n", "99250 | \n", "O | \n", "
99252 | \n", "2995 | \n", "6885 | \n", "11 | \n", "99252 | \n", "this | \n", "this | \n", "438936 | \n", "438940 | \n", "DET | \n", "DT | \n", "det | \n", "99253 | \n", "O | \n", "
99253 | \n", "2995 | \n", "6885 | \n", "12 | \n", "99253 | \n", "summer | \n", "summer | \n", "438941 | \n", "438947 | \n", "NOUN | \n", "NN | \n", "npadvmod | \n", "99245 | \n", "O | \n", "
99254 | \n", "2995 | \n", "6885 | \n", "13 | \n", "99254 | \n", ".... | \n", ".... | \n", "438947 | \n", "438951 | \n", "PUNCT | \n", ". | \n", "punct | \n", "99243 | \n", "O | \n", "
99255 | \n", "2995 | \n", "6885 | \n", "14 | \n", "99255 | \n", "\\t | \n", "438951 | \n", "438952 | \n", "PUNCT | \n", "'' | \n", "punct | \n", "99243 | \n", "O | \n", "NaN | \n", "
99256 rows × 13 columns
\n", "\n", " | COREF | \n", "start_token | \n", "end_token | \n", "prop | \n", "cat | \n", "text | \n", "
---|---|---|---|---|---|---|
0 | \n", "364 | \n", "0 | \n", "0 | \n", "PROP | \n", "PER | \n", "Mr. | \n", "
1 | \n", "92 | \n", "2 | \n", "3 | \n", "PROP | \n", "PER | \n", "Mrs. Dursley | \n", "
2 | \n", "1 | \n", "9 | \n", "10 | \n", "PROP | \n", "FAC | \n", "Privet Drive | \n", "
3 | \n", "365 | \n", "17 | \n", "17 | \n", "PRON | \n", "PER | \n", "they | \n", "
4 | \n", "366 | \n", "23 | \n", "23 | \n", "PRON | \n", "PER | \n", "you | \n", "
... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
15858 | \n", "2355 | \n", "99227 | \n", "99227 | \n", "PRON | \n", "PER | \n", "They | \n", "
15859 | \n", "2351 | \n", "99231 | \n", "99231 | \n", "PRON | \n", "PER | \n", "we | \n", "
15860 | \n", "441 | \n", "99239 | \n", "99239 | \n", "NOM | \n", "FAC | \n", "home | \n", "
15861 | \n", "98 | \n", "99241 | \n", "99241 | \n", "PRON | \n", "PER | \n", "I | \n", "
15862 | \n", "95 | \n", "99251 | \n", "99251 | \n", "PROP | \n", "PER | \n", "Dudley | \n", "
15863 rows × 6 columns
\n", "\n", " | COREF | \n", "start_token | \n", "end_token | \n", "prop | \n", "cat | \n", "text | \n", "
---|---|---|---|---|---|---|
0 | \n", "364 | \n", "0 | \n", "0 | \n", "PROP | \n", "PER | \n", "Mr. | \n", "
1 | \n", "92 | \n", "2 | \n", "3 | \n", "PROP | \n", "PER | \n", "Mrs. Dursley | \n", "
2 | \n", "1 | \n", "9 | \n", "10 | \n", "PROP | \n", "FAC | \n", "Privet Drive | \n", "
3 | \n", "365 | \n", "17 | \n", "17 | \n", "PRON | \n", "PER | \n", "they | \n", "
4 | \n", "366 | \n", "23 | \n", "23 | \n", "PRON | \n", "PER | \n", "you | \n", "
... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
15858 | \n", "2355 | \n", "99227 | \n", "99227 | \n", "PRON | \n", "PER | \n", "They | \n", "
15859 | \n", "2351 | \n", "99231 | \n", "99231 | \n", "PRON | \n", "PER | \n", "we | \n", "
15860 | \n", "441 | \n", "99239 | \n", "99239 | \n", "NOM | \n", "FAC | \n", "home | \n", "
15861 | \n", "98 | \n", "99241 | \n", "99241 | \n", "PRON | \n", "PER | \n", "I | \n", "
15862 | \n", "95 | \n", "99251 | \n", "99251 | \n", "PROP | \n", "PER | \n", "Dudley | \n", "
15863 rows × 6 columns
\n", "\n", " | quote_start | \n", "quote_end | \n", "mention_start | \n", "mention_end | \n", "mention_phrase | \n", "char_id | \n", "quote | \n", "
---|---|---|---|---|---|---|---|
0 | \n", "434 | \n", "438 | \n", "443 | \n", "443 | \n", "he | \n", "93 | \n", "Little tyke , | \n", "
1 | \n", "1089 | \n", "1108 | \n", "1085 | \n", "1085 | \n", "they | \n", "417 | \n", "The Potters , that 's right , that 's what I ... | \n", "
2 | \n", "1343 | \n", "1346 | \n", "1347 | \n", "1347 | \n", "he | \n", "93 | \n", "Sorry , | \n", "
3 | \n", "1416 | \n", "1460 | \n", "1405 | \n", "1405 | \n", "he | \n", "435 | \n", "Do n't be sorry , my dear sir , for nothing c... | \n", "
4 | \n", "1603 | \n", "1606 | \n", "1608 | \n", "1609 | \n", "Mr. Dursley | \n", "93 | \n", "Shoo ! | \n", "
... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
2322 | \n", "99133 | \n", "99146 | \n", "99147 | \n", "99147 | \n", "He | \n", "119 | \n", "Hurry up , boy , we have n't got all day . | \n", "
2323 | \n", "99163 | \n", "99172 | \n", "99161 | \n", "99161 | \n", "Hermione | \n", "220 | \n", "See you over the summer , then . | \n", "
2324 | \n", "99173 | \n", "99184 | \n", "99186 | \n", "99186 | \n", "Hermione | \n", "220 | \n", "Hope you have -- er -- a good holiday , | \n", "
2325 | \n", "99202 | \n", "99208 | \n", "99210 | \n", "99210 | \n", "Harry | \n", "98 | \n", "Oh , I will , | \n", "
2326 | \n", "99226 | \n", "99255 | \n", "99210 | \n", "99210 | \n", "Harry | \n", "98 | \n", "They do n't know we 're not allowed to use ma... | \n", "
2327 rows × 7 columns
\n", "\n", " | start_token | \n", "end_token | \n", "supersense_category | \n", "text | \n", "
---|---|---|---|---|
0 | \n", "0 | \n", "0 | \n", "noun.person | \n", "Mr. | \n", "
1 | \n", "2 | \n", "3 | \n", "noun.person | \n", "Mrs. Dursley | \n", "
2 | \n", "6 | \n", "6 | \n", "noun.quantity | \n", "number | \n", "
3 | \n", "7 | \n", "7 | \n", "noun.quantity | \n", "four | \n", "
4 | \n", "9 | \n", "10 | \n", "noun.location | \n", "Privet Drive | \n", "
... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
29313 | \n", "99239 | \n", "99239 | \n", "noun.location | \n", "home | \n", "
29314 | \n", "99245 | \n", "99245 | \n", "verb.perception | \n", "have | \n", "
29315 | \n", "99249 | \n", "99249 | \n", "noun.act | \n", "fun | \n", "
29316 | \n", "99251 | \n", "99251 | \n", "noun.person | \n", "Dudley | \n", "
29317 | \n", "99253 | \n", "99253 | \n", "noun.time | \n", "summer | \n", "
29318 rows × 4 columns
\n", "