3-6 лет / Национальный корпус английского языка онлайн

Английские интернет-корпорации

Многие преподаватели и слушатели языка просто хотят знать одну простую вещь: где находятся свободные, доступные корпорации в Интернете, которые мы можем искать прямо без хлопот? Не много! Вот основные из них. Я оставил литературу, газеты и блоги, потому что их легко найти, и здесь миллионы людей.

Британский национальный корпус (БНК)

[100 м слов; Британский английский, 1990-е, разговорный и письменный]: существует множество различных веб-сайтов, которые предоставляют бесплатный (но ограниченный) доступ к телу - с ограничением авторских прав: это означает, что вы не можете расширить контекст соглашения, чтобы прочитать больше текста, и Вы не можете читать целые исходные тексты (только фрагменты).

  • BNCweb: удобный, бесплатный интерфейс.
  • JustTheWord: самый доступный веб-сайт для студентов, не говорящих по-английски (и наиболее полезный с педагогической точки зрения), поскольку напрямую дает вам список разговоров для поискового слова / фразы. соответствия; результаты классифицируются на основе моделей POS и приблизительных кластеров датчиков, а графики показывают, насколько распространена каждая комбинация. Результаты основаны на подмножестве BNC 80 cli.
  • BYU-BNC (ранее «LOOK»): позволяет искать BNC по слову, фразе или частичному языку с ограничениями жанра; позволяет подчеркнуть & "нечеткие спички"; Можно перечислить словосочетания. Регистрация требуется (бесплатно) после примерно 20 запросов.
  • Английские фразы (PIE; убедитесь, что вы находитесь на странице N грамм) - позволяет искать слова / фразы BNC, возвращая до 50 случайных совпадений (введите слова или фразы (до 8 слов)), одно слово за коробку).
  • BNC в Интернете: практически нет веских причин использовать этот сайт, поскольку он имеет так много ограничений: ограничен макс. из 50 случайных попаданий; ограниченный контекст влево / вправо; только предложение (поисковый термин не выделен и не в центре экрана); не может искать только через POS; не может быть ограничено определенными жанрами; и т. д. [Совет для пользователей EFL: знайте, из каких жанров взяты примеры ваших матчей (например, подростковые журналы и неформальный язык не всегда могут обеспечить лучшие языки для академического письма)

Другой онлайн корпус на Corpus.byu.edu (сайт Марка Дэвиса)

Исторический американский английский (COHA) Дело: [400 м слов; Американский английский; ежегодно с 1810 по 2009 г.]

Дело журнала TIME: [100 м слов американский английский, 1923-2006; Более 275 000 статей ВРЕМЕНИ. Широкий спектр тем: новости, спорт, бизнес, культура, здоровье, развлечения и т.д.] Хороший интерфейс поиска (по сути, такой же, как в БЮ-БНК и КОКА).

[1,7 миллиона слов на современном академическом разговорном американском английском, написанном преподавателями, студентами и сотрудниками на официальном и неофициальном уровне в университете]: полностью доступный для поиска и удобный для пользователя (без ограничений)), и теперь выбрал воспроизводимый звук файлы, чтобы сопровождать некоторые стенограммы. Домашняя страница здесь.

[Джон Милтон. Corpora = - это сочетание устного и письменного английского жанра (выбирается пользователем); некоторые тексты взяты из BNC]: довольно похоже на JustThe Word с точки зрения предоставления списков колографических образцов сначала (которые затем относятся к фактическим образцам жилья), но текстовая база данных больше (не ограничивается текстами BNC), и вы можете ограничить средний (разговорный / письменный) и по жанрам. Это довольно обширная среда обучения: образцы каллиграфии / разговорного языка и корпусов, интегрированные в онлайн-словари, тезаурусы, энциклопедии, переводы на китайский язык, Answers.com, JustTheWord и даже примеры аудио / видео с фразой / шаблоном.

LOB & Brown [1 миллион слов каждое; 1960-е годы написаны на английском (LOB) и американском английском (коричневый)]

Коричневый корпус американского английского доступен на веб-сайте Lextutor. Браун и LOB использовались для поиска в Виртуальном языковом центре (не работает ли он?), Или на веб-сайте Альтернативного эдикта (не работает?) (Ранее доступ к нему был ограничен в 2001 году). Есть также другие текстовые коллекции на сайтах VLC / edict - см. Здесь, чтобы описать и разбить эти более специализированные корпорации.

Поиск в разных корпорациях (на многих языках). Английская корпорация включает тексты из электронных писем Википедии и Энрона.

[Компьютерные пособия, выступления Европейского парламента, субтитры и т.д.] Коллекция с открытым исходным кодом свободно доступных для поиска / загружаемых одноязычных и параллельных (переводных) корпораций или коллекций.

[стр.14К слов; сопоставление предложений сценариев «Голоса Америки», в которых используется ограниченный словарный запас из 1500 слов (не обязательно самых «простых» английских слов, но самых простых)]. Сценарии - это «письменный» английский; полезно для менее владеющих английским языком.

Двуязычные (английский и португальский) сравнительные технические языки (связанные с COMET) в 5 областях: кулинария, контракты, информатика, окружающая среда и гипертония. Сами тексты не могут быть загружены, но их можно искать с помощью предоставленных веб-инструментов: конкордер, список слов и граммы N-граммы.

включает небольшое количество англоговорящих подростков. Содержит структурированные видео-интервью со студентами в возрасте 13-18 лет (всего семь европейских языков). Аннотируется и обогащается для изучения языка. Бесплатный мультимедийный доступ (видео).

TCSE - это поисковая система, специализирующаяся на стенограммах TED Talk. Он предназначен для образовательных и научных целей.

BACKBONE (европейские языки, включая английский)

BACKBONE - европейский проект; Сетевая образовательная корпорация для видеозаписей разговорных интервью с носителями английского, французского, немецкого, польского, испанского и турецкого языков, а также с носителями английского языка, такими как Lingua Franca (ELF).

Есть много других корпораций, которые бесплатны, но не онлайн, включая большинство корпораций ICE (просто подпишите лицензию и загрузите файлы). Если вас интересует не родной английский, в PICLE Corpus (аргументированные эссе и литературные экзамены польских преподавателей английского) можно найти онлайн.

Смотрите. Также раздел Использование Интернета в качестве оболочки (многие из этих поисковых систем в Интернете позволяют ограничить поиск определенными странами, учреждениями, URL-адресами / веб-сайтами и т.д., Тем самым уменьшая количество ненужных / нежелательных хитов), и изучают корпоративный раздел выше. для не авторских газет, не защищенных авторским правом литературных текстов и Библий. Большинство из них не являются «корпорациями» в строгом смысле структурирования и форматирования в соответствии с современными стандартами корпуса, но являются отправной точкой, если вы хотите иметь собственные бесплатные тексты для выполнения согласований.

XX Wordbanks Интернет (от Банка английского языка) [БЕЗ БОЛЬШЕ БЕСПЛАТНО?]: Поиск по 56-миллионному подмножеству Банка английского языка (разделено на 3 широких категории); также полезно для указания следующего слова части и предоставления словосочетаний (ограничено 40 попаданий; общее число попаданий не сообщается :-()

* Что-то осталось от меня? Если вы знаете другие корпорации, вы можете искать в Интернете, дайте мне знать.

Считаете ли вы этот сайт / страницу полезным? Дайте мне знать, если вы хотите, чтобы я продолжал обновлять мой сайт, или если у вас есть новое здание или ресурс (или что-то, что я пропустил) для ссылки, пожалуйста, оставьте мне строку.

В Martin Weisserie, 2016; Последний раз редактировалось: суббота, 04 ноября 10:50:58 2017; ориг. В Дэвид Ли, 2001