Часто студенты, имеющие большой объем знаний о грамматике и лексике изучаемого языка, не могут использовать его идиоматически, как это делают носители языка. Цель нашего проекта — создание нового технического средства обучения, которое решает как раз эту задачу: изучение сочетаемости слов. Основное внимание мы уделяем онлайн-сервису, который поощряет студентов к активному «исследованию» — к участию в процессе обучения, в отличие от более традиционного освоения языка через накопление пассивного знания. В этом контексте тип обучения, к которому мы стремимся, можно назвать «интерактивным». Проект CoCoCo основан на нескольких принципах:
- использование больших аннотированных корпусов русского языка;
- анализ сочетаний слов с использованием статистических методов (corpus-driven approach);
- создание удобной системы обучения, генерирующей ответы на индивидуальные запросы.
Ресурс разработан исследовательской группой на базе Хельсинкского университета. Проект частично финансируется Национальным агентством образования Финляндии EDUFI.
РУКОВОДСТВОМихаил Копотев, PhD, адъюнкт-профессор Отделения современных языков, Хельсинкский университет
УЧАСТНИКИ- Любовь Иванова, магистр, научный ассистент, Высшая школа экономики, Москва
- Эдуард Клышинский, PhD, доцент, Отделение информатики, Высшая школа экономики, Москва
- Дарья Кормачева, аспирант, Отделение современных языков, Хельсинкский университет
- Наталья Кочеткова, аспирант, Отделение информатики, Высшая школа экономики, Москва
- Елизавета Кузьменко, магистр, Высшая школа экономики, Москва
- Андрей Кутузов, аспирант, Университет Осло
- Екатерина Ниронен, магистрант, Университет прикладных наук Метрополия, Хельсинки
- Лидия Пивоварова, аспирант, Отделение информатики, Хельсинкский университет
- Мэттью Пирс, магистрант, Отделение информатики, Хельсинкский университет
- Мария Хохлова, PhD, доцент, Санкт-Петербургский государственный университет
- Андрей Шепелев, магистр, научный ассистент, Отделение современных языков, Хельсинкский университет
- Роман Янгарбер, PhD, исследователь, Отделение информатики, Хельсинкский университет
Мы весьма признательны разработчикам Национального корпуса русского языка (в особенности Е. Рахилиной и О. Ляшевской) и корпуса Araneum Russicum (в особенности В. Бенко) за предоставленные данные. Все права на исходные данные принадлежат их владельцам.
КОНТАКТЫСвязаться с нами можно по адресу mihail dot kopotev at helsinki dot fi.
We often see students who possess a great deal of knowledge about the language on a theoretical level but are unable to use it idiomatically, in a manner that native speakers can do. Instructors teaching a foreign language are regularly asked how words co-occur. Thus, our goal is to create a technological solution that answers these questions and revolutionizes learning of a foreign language (Russian in this case). The primary focus is on providing web-based tools that stimulate active, participatory learning as opposed to more traditional ways of absorptive learning, which results in accumulation of passive knowledge. In this case, students are simply incapable of utilizing the acquired knowledge and skills in real life. Taking this issue into account, we refer to our target mode of learning as "interactive learning". To be more precise, the CoCoCo project encompasses several directions:
- utilizing large-scale annotated corpora
- analysis of word co-occurrences using statistic methods and a corpus-driven approach;
- building a user-friendly system that generates answers on demand.
This resource was developed by the research group based at the University of Helsinki. The CoCoCo project is partially financed by the Finnish National Agency for Education EDUFI.
LEADERSHIPMikhail Kopotev, PhD, Assoc. Professor, Department of Languages, University of Helsinki
PARTICIPANTS- Lyubov Ivanova, MA, Research Assistant, Higher School of Economics, Moscow
- Eduard Klyshinsky, PhD, Associate Professor, Department of Computer Science, Higher School of Economics, Moscow
- Daria Kormacheva, PhD Student, Department of Modern Languages, University of Helsinki
- Natalia Kochetkova, PhD Student, Department of Computer Science, Higher School of Economics, Moscow
- Elizaveta Kuzmenko, MA, Higher School of Economics, Moscow
- Andrey Kutuzov, PhD Student, University of Oslo
- Ekaterina Nironen, MA Student, Metropolia University of Applied Sciences, Helsinki
- Lidia Pivovarova, PhD Student, Department of Computer Science, University of Helsinki
- Matthew Pierce, MA Student, Department of Computer Science, University of Helsinki
- Maria Khokhlova, PhD, Associate Professor, Saint Petersburg State University
- Andrey Shepelev, MA, Research Assistant, Department of Modern Languages, University of Helsinki
- Roman Yangarber, PhD, Researcher, Department of Computer Science, University of Helsinki
We are grateful to the developers of the Russian National Corpus (especially E. Rakhilina and O. Lyashevskaya) and the Araneum Russicum corpus (especially V. Benko) for providing data. All rights to the original data belong to their respective owners.
CONTACTYou can reach us at mihail dot kopotev at helsinki dot fi.
Часто студенти, маючи великий обсяг знань граматики та лексики вивченої мови, не можуть використовувати її ідіоматично, як це роблять носії мови. Мета нашого проєкту — створення нового технічного засобу навчання, який вирішує саме цю проблему — вивчення сполучуваності слів. Основну увагу приділено онлайн-сервісу, мета якого — заохочення студентів до активного «дослідження». Відтак безпосередня участь у процесі навчання суттєво різниться від традиційного опанування мови, коли здобувачі освіти нагромаджують пасивні знання, не маючи чіткого уявлення про те, яким чином вони можуть бути застосовані на практиці. У цьому контексті тип навчання, що до нього ми прагнемо, можна назвати «інтерактивним». Проєкт "CoCoCo" базується на декількох принципах:
- використання анотованого корпусу української мови ГРАК;
- аналіз словосполучень і сполучень слів із використанням статистичних методів (corpus-driven approach);
- створення зручної системи, що генерує відповіді на індивідуальні запити.
Пропонований ресурс розроблено дослідницькою групою на базі Гельсінського університету. Проєкт частково фінансується Національним агентством освіти Фінляндії EDUFI.
КЕРІВНИЦТВОМихайло Копотєв, PhD, доцент кафедри сучасних мов, Гельсінський університет.
УЧАСНИКИ- Адамусік Каріна, адміністратор проєкту
- Пономар Дмитро, IT-спеціаліст проєкту
- Миронюк Світлана, адміністратор проєкту
- Гарбера Ірина, керівник студентів Донецького національного університету імені Василя Стуса
- Арсеній Лукашевський, IT-спеціаліст проєкту
Студенти Донецького національного університету імені Василя Стуса:
- Гуменюк Марія Андріївна
- Даценко Єлизавета Володимирівна
- Костенко Іван Васильович
- Лященко Каріна В'ячеславівна
- Малюта Анна Андріївна
- Мордюк Анна Сергіївна
- Овчарук Анастасія Іванівна
- Поліщук Марина Ігорівна
- Пудова Анастасія Сергіївна
- Рупа Олена Олександрівна
- Сліденко Юлія Сергіївна
- Дев'ятко Мирослава Сергіївна
- Зарічнюк Анастасія Сергіївна
- Куценко Діана Василівна
- Луцишина Наталія Дмитрівна
- Палагно Ксенія Павлівна
- Перепелюк Анна Сергіївна
Висловлюємо глибоку вдячність і шану розробникам корпусу української мови ГРАК (особливо Марії Шведовій) за надання даних. Усі права на вихідні дані належать їхнім власникам.
КОНТАКТИЗв'язатися з нами можна за адресою mihail dot kopotev at helsinki dot fi. Будемо вдячні за будь-які зауваження, коментарі й поради щодо розвитку проєкту.
We often see students who have a great deal of knowledge about the language on the theoretical level, but are unable to use it idiomatically, in a way native speakers can do. Instructors teaching a foreign language are regularly asked how words co-occur. Thus, our goal is to create a technological solution that answers these questions and revolutionizes learning of a foreign language (Ukrainian in this case). The primary focus is on providing web-based tools that stimulate active, participatory learning as opposed to more traditional ways of absorptive learning, which results in accumulation of passive knowledge. In this case, students are simply incapable of utilizing the acquired knowledge and skills in their real life. Taking this issue into account, we refer to our target mode of learning as "interactive learning". To be more precise, the CoCoCo project encompasses several directions:
- utilizing large-scale annotated corpora of the Ukrainian language GRAC;
- analysis of word co-occurrences using statistic methods and a corpus-driven approach;
- building a user-friendly system that generates answers on demand.
This resource was developed by the research group based at the University of Helsinki. The CoCoCo project is partially financed by the Finnish National Agency for Education EDUFI.
GROUP LEADERMikhail Kopotev, PhD, Associate Professor of Modern Languages, University of Helsinki.
PARTICIPANTS- Karina Adamusik, project administrator
- Dmytro Ponomar, IT specialist of the project
- Svitlana Myronyuk, project administrator
- Iryna Garbera, mentor of students from Vasyl Stus Donetsk National University
- Arsenii Lukashevskyi, IT specialist of the project
Students from Vasyl Stus Donetsk National University:
- Maria Gumenyuk
- Elizaveta Datsenko
- Ivan Kostenko
- Karina Lyashchenko
- Anna Malyuta
- Anna Mordyuk
- Anastasia Ovcharuk
- Marina Polischuk
- Anastasia Pudova
- Olena Rupa
- Yulia Slidenko
- Myroslava Devyatko
- Anastasia Zarichnyuk
- Diana Kutsenko
- Natalia Lutishina
- Ksenia Palagno
- Anna Perepelyuk
We express our deep gratitude and respect to the developers of the GRAC Ukrainian language corpus (especially to Maria Shvedova) for providing us with data. All rights to the original data belong to their owners.
CONTACTSFeel free to write us at mihail dot kopotev at helsinki dot fi. We are always glad to receive comments and suggestions regarding improvement of the project.
Часто студэнты, якія маюць вялікі аб'ём ведаў пра граматыку і лексіку мовы, якую вывучаюць, не могуць карыстацца ёй ідыяматычна, як гэта робяць носьбіты мовы. Мэта нашага праекта — стварэнне новага тэхнічнага сродку навучання, які вырашае якраз гэту задачу: вывучэнне спалучальнасці слоў. Асноўную ўвагу мы ўдзяляем анлайн-сэрвісу, які падштурхоўвае студэнтаў да актыўнага «даследавання» — да ўдзелу ў працэсе навучання, у адрозненне ад традыцыйнага засваення мовы праз назапашванне пасіўных ведаў. Праект CoCoCo заснаваны на некалькіх прынцыпах:
- выкарыстанне буйных анатаваных корпусаў беларускай мовы;
- аналіз спалучэнняў слоў з выкарыстаннем статыстычных метадаў (corpus-driven approach);
- стварэнне зручнай сістэмы навучання, якая генеруе адказы на індывідуальныя запыты.
Рэсурс распрацаваны даследчыцкай групай на базе Хельсінскага ўніверсітэта. Праект часткова фінансуецца Нацыянальным агенцтвам адукацыі Фінляндыі EDUFI.
КІРАЎНІЦТВАМіхаіл Копацеў, PhD, ад'юнкт-прафесар Аддзялення сучасных моў, Хельсінскі ўніверсітэт
УДЗЕЛЬНІКІ- Любоў Іванава, магістр, навуковы асістэнт, Вышэйшая школа эканомікі, Масква
- Эдуард Клышынскі, PhD, дацэнт, Аддзяленне інфарматыкі, Вышэйшая школа эканомікі, Масква
- Лідзія Піваварава, аспірант, Аддзяленне інфарматыкі, Хельсінскі ўніверсітэт
- Раман Янгарбер, PhD, даследчык, Аддзяленне інфарматыкі, Хельсінскі ўніверсітэт
Мы вельмі ўдзячны распрацоўшчыкам Нацыянальнага корпуса рускай мовы (асабліва Я. Рахілінай і В. Ляшэўскай) і корпуса Araneum Russicum (асабліва В. Бенко) за прадастаўленыя даныя. Усе правы на зыходныя даныя належаць іх уладальнікам.
КАНТАКТЫЗвязацца з намі можна па адрасе mihail dot kopotev at helsinki dot fi.
We often see students who possess a great deal of knowledge about the language on a theoretical level but are unable to use it idiomatically, in a manner that native speakers can do. Our goal is to create a technological solution that answers these questions and revolutionizes learning of a foreign language (Belarusian in this case). The primary focus is on providing web-based tools that stimulate active, participatory learning as opposed to more traditional ways of absorptive learning. The CoCoCo project encompasses several directions:
- utilizing large-scale annotated corpora of the Belarusian language;
- analysis of word co-occurrences using statistic methods and a corpus-driven approach;
- building a user-friendly system that generates answers on demand.
This resource was developed by the research group based at the University of Helsinki. The CoCoCo project is partially financed by the Finnish National Agency for Education EDUFI.
LEADERSHIPMikhail Kopotev, PhD, Assoc. Professor, Department of Languages, University of Helsinki
CONTACTYou can reach us at mihail dot kopotev at helsinki dot fi.