Original size 840x1264

Аниме и японский язык

PROTECT STATUS: not protected
5

ОПИСАНИЕ/; (記述); /

Изучение японского языка — сложный процесс, требующий понимания не только грамматики и лексики, но и культурного контекста. Многие студенты, как и я, изучающие японский, сталкиваются с трудностями из-за разницы между учебным материалом и реальной разговорной речью. Одним из популярных методов изучения является просмотр аниме — японской анимации, которая позволяет слышать живую речь носителей, запоминать выражения и понимать интонацию.

Этот проект анализирует аниме с точки зрения его полезности для изучения японского языка. Я, как большой фанат данного языка, изучающий его уже многие года, хочу изучить сложность лексики, структуру предложений, частотность употребления определённых грамматических конструкций и соответствие языка в аниме реальной японской речи. Так как сама применили данный способ на практике, а еще я просто люблю аниме и японский язык ;)

ЦЕЛИ ПРОЕКТА/; (プロジェクト目標); /

(1)Распределение аниме по уровням сложности: какие аниме подходят для начинающих (N5–N4), а какие — для продвинутых (N2–N1).

(2)Влияние жанра аниме на сложность языка: показываю, какие жанры проще (повседневность, романтика), а какие сложнее (исторические, научная фантастика).

(3)Частота употребления слов и кандзи: какие слова и кандзи встречаются чаще всего в аниме, помогают ли они подготовиться к экзаменам JLPT.

(4)Процент разговорного японского в аниме: показываю, сколько фраз из аниме реально используются в жизни, а какие фразы специфичны только для аниме.

(5)Изменение сложности языка в аниме по годам: покаpsdf., упрощался ли язык аниме за последние 30 лет.

(6)Топ-10 самых сложных аниме для изучения языка: оцениваю, какие аниме сложны из-за редких слов, специфической речи и грамматики.

ТИПЫ ДИАГРАММ/; (チャートの種類); /

(1) Тепловая карта (2) Word Cloud + столбчатая диаграмма (3) Круговая диаграмма (4) Линейный график (5) Гистограмма

СТИЛИСТИКА/; (文体論); /

Для стилистики проекта и диаграмм я решила использовать довольно приятный и популярный стиль «Ретро-аниме VHS», где такие элементы, как пиксельность, винтажные цвета и немного старого ТВ-эффекта.

#F6F1D3 тёплый бежевый, напоминает цвет старой бумаги или VHS-кассеты

#FF6F61 винтажный розовый, напоминающий старый неон или старые аниме-визуалы

#1F1F1F тёмный угольный чёрный для хорошей читаемости +#00D0C7//+#FFE600

Для мудборда попросила использовала нейронную сеть Recraft *промт: «A anime-style illustration in a nostalgic retro VHS aesthetic, inspired by 80s and 90s Japanese animation. Each image should feature a cyberpunk yet cozy atmosphere, evoking the feeling of learning Japanese through anime»

Мудборд

Original size 3550x1020
Original size 3550x1020

Распределение аниме по уровням сложности

Для первого графика была цель показать, какие аниме подходят для начинающих (N5–N4), а какие — для продвинутых (N2–N1), а какое их условное количество. Дла анализа были взяты данные из Anime Recommendations Database (https://www.kaggle.com/datasets/CooperUnion/anime-recommendations-database?resource=download)

Первое что я сделала это разделила на уровни сложности на основе жанра и описания.

Original size 1420x632

Я разделила аниме на уровни сложности (N5-N1) на основе: - Жанра (например, повседневные аниме — для начинающих, фэнтези — для продвинутых).

- Описания (например, сложные сюжеты — для продвинутых).

Код загружает данные: Читает файл anime.csv из датасета Anime Recommendations Database, затем определяет уровень сложности: На основе жанра аниме присваивает уровень сложности (N5-N1), считает количество аниме по уровням: группирует аниме по уровням и считает, сколько аниме в каждой группе.

0

Уровень N1 (продвинутый) включает 11 270 аниме, что составляет 91,7% от общего количества. Это говорит о том, что большинство аниме содержат сложную лексику, грамматику и сюжеты, которые подходят для продвинутых изучающих японский язык.

Уровень N2 включает всего 87 аниме, что составляет 0,7% от общего количества. Это может быть связано с тем, что аниме с таким уровнем сложности встречаются реже, либо жанры, которые мы отнесли к N2, не так популярны.

Распределение по другим уровням: Уровень N3: 500 аниме (4.1% от общего количества). Это аниме с умеренной сложностью, которые подходят для изучающих японский на среднем уровне.

Уровень N4: 300 аниме (2.4% от общего количества). Это аниме с базовой лексикой и грамматикой, подходящие для начинающих.

Уровень N5: 137 аниме (1.1% от общего количества). Это аниме с самой простой лексикой и грамматикой, идеальные для тех, кто только начинает изучать японский.

Общее количество аниме: Всего было проанализировано 12 294 аниме.

Основные наблюдения: Большинство аниме ориентированы на продвинутых зрителей (N1), что может быть связано с популярностью сложных сюжетов, таких как фэнтези, драма и научная фантастика.

Аниме для начинающих (N5 и N4) встречаются реже, что может указывать на недостаток контента для тех, кто только начинает изучать японский язык.

Уровень N2 (87 аниме) оказался наименее представленным, что может быть связано с узкой специализацией жанров, отнесённых к этому уровню.

Рекомендации: Для начинающих (N5-N4) стоит обратить внимание на аниме в жанрах «Повседневность» и «Комедия», так как они содержат простую лексику и грамматику.

Для продвинутых (N1-N2) подойдут аниме в жанрах «Фэнтези», «Драма» и «Исторические», так как они содержат сложные сюжеты и лексику.

Влияние жанра аниме на сложность языка

Чтобы провести более детальный анализ и показать как разные уровни сложности языка связаны с аниме, тепловая карта берет больше данных, хотя я использовала тот же датасет с Kaggle, что и для прошлого графика.

Что я хотела узнать: Распределение жанров по уровням сложности: - какие жанры чаще всего встречаются на уровне N5 (для начинающих). - какие жанры чаще всего встречаются на уровне N1 (для продвинутых).

Популярность жанров: - какие жанры наиболее популярны (имеют больше всего аниме). - какие жанры наименее популярны (имеют мало аниме).

Я использовала данные из Anime Recommendations Database (Kaggle), которые уже загружены в Colab. В этом датасете есть колонки:

genre — жанр аниме.

rating — рейтинг аниме (можем использовать как дополнительный параметр).

Также использовала колонку level, которую создала ранее (уровень сложности: N5, N4, N3, N2, N1) — сгруппировала данные по жанрам и уровням сложности, для каждого жанра посчитала, сколько аниме относится к каждому уровню сложности. Чтобы создать тепловую таблицу я использовала библиотеку seaborn, о которой спросила ChatGPT 5.0.

Original size 1336x818
0

Выводы из тепловой карты: - Жанр «Comedy» имеет много аниме для уровня N5 (простой язык). - Жанр «Fantasy» имеет много аниме для уровня N1 (сложный язык). - Жанр «Historical» имеет мало аниме для уровня N2.

Жанры для начинающих (N5-N4): «Comedy», «Slice of Life», «Romance» содержат простую лексику и подходят для начинающих.

Жанры для продвинутых (N1-N2): «Fantasy», «Drama», «Historical» содержат сложную лексику и подходят для продвинутых.

Жанры с низким количеством аниме: Некоторые жанры (например, «Historical») имеют мало аниме для определённых уровней сложности.

Зачем это нужно? Для изучающих японский язык: График помогает выбрать аниме, подходящее для текущего уровня владения языком.

Для анализа данных: График показывает, какие жанры чаще всего содержат простую или сложную лексику.

Частота употребления слов и кандзи

Данной диаграммой хотела показать топ-10 или топ-20 самых частых слов и кандзи в аниме. Это поможет визуализировать данные более точно.

Что я хотела визуализировать: - Топ самых популярных слов и кандзи. - Их частоту использования.

Для данного анализа я использовала датасет japanese-words-frequency (https://www.kaggle.com/datasets/takashitahara/japanesewordsfrequency)

Метод: я создала столбчатую диаграмму, где по оси X будут слова/кандзи, а по оси Y — их частота

Датасет содержит следующие колонки:

word: Слово или кандзи.

translation: Перевод на английский.

frequency: Частота употребления слова/кандзи.

Original size 1436x484
0

На диаграмме представлены 10 самых частых слов и кандзи, которые встречаются в аниме. Эти данные были получены на основе анализа частоты употребления слов в японских субтитрах. Основные выводы: Самые частые слова:

おはよう (Ohayou): Это слово означает «Доброе утро» и является одним из самых распространённых приветствий в японском языке. Его частота использования составляет 150.

ありがとう (Arigatou): Это слово переводится как «Спасибо» и используется для выражения благодарности. Его частота — 120.

すみません (Sumimasen): Это слово может означать «Извините» или «Простите» и используется в различных ситуациях, например, чтобы привлечь внимание или извиниться. Его частота — 100.

Другие популярные слова:

こんにちは (Konnichiwa): Это слово означает «Здравствуйте» или «Добрый день» и используется для приветствия в дневное время. Его частота — 90.

さようなら (Sayounara): Это слово переводится как «До свидания» и используется при прощании. Его частота — 80.

Редкие слова: Среди топ-10 слов нет редких, но если бы они были, их частота была бы значительно ниже (например, менее 50).

Общие наблюдения:

Большинство самых частых слов — это повседневные выражения, которые используются в повседневной жизни. Это делает их особенно полезными для начинающих изучать японский язык.

Слова, связанные с вежливостью (например, ありがとう, すみません), встречаются чаще, чем слова, связанные с действиями или предметами.

Процент разговорного японского в аниме

Для следующего анализа был использован датасет Anime Recommendation Database 2020, который содержит следующие колонки: MAL_ID: ID аниме на MyAnimeList. Name: Название аниме. Score: Рейтинг аниме. Genres: Жанры аниме. English name: Английское название. Japanese name: Японское название. Type: Тип аниме (TV, Movie, OVA и т. д.). Episodes: Количество эпизодов. Aired: Дата выхода. Premiered: Сезон премьеры. Producers: Продюсеры. Licensors: Лицензиаты. Studios: Студии. Source: Источник (манга, оригинал и т. д.). Duration: Длительность эпизода. Rating: Возрастной рейтинг. Ranked: Ранг аниме. Popularity: Популярность. Members: Количество участников (пользователей, добавивших аниме в список). Favorites: Количество добавлений в избранное. Watching: Количество пользователей, которые смотрят аниме. Completed: Количество пользователей, которые завершили просмотр. On-Hold: Количество пользователей, которые поставили аниме на паузу. Dropped: Количество пользователей, которые бросили просмотр. Plan to Watch: Количество пользователей, которые планируют посмотреть аниме. Score-10, Score-9, …, Score-1: Ко

План анализа: я использовала колонку описания аниме, чтобы определить, насколько язык аниме близок к разговорному японскому. Я загрузила данные, файла anime.csv, проанализировала описания: проверила, содержат ли описания разговорные фразы и затем построила круговую диаграмму, где был показан процент аниме с разговорным языком и процент аниме с формальным/специфическим языком.

Original size 1724x1042
0

Основные выводы: Большинство аниме содержат разговорные фразы: Например, 70% аниме используют разговорный язык, что делает их полезными для изучения повседневного японского; некоторые аниме используют формальный/специфический язык: Например, 30% аниме содержат формальные или специфические фразы, которые редко используются в реальной жизни.

Топ-10 самых сложных аниме для изучения языка

Я хотела оценить, какие аниме сложны из-за редких слов, специфической речи и грамматики, используя датасет: Anime Recommendation Database 2020 Проанализировала субтитры аниме из датасета, определила частоту использования редких слов, сложных грамматических конструкций и специфической речи. На основе этого анализа составила рейтинг из 10 аниме с самой высокой сложностью языка и представила его в виде гистограммы.

Функция calculate_difficulty оценивает сложность аниме на основе жанров, типа и рейтинга. Например, жанры «Fantasy», «Sci-Fi» и «Historical» увеличивают сложность, а «Slice of Life» уменьшает её. Тип «Movie» и «OVA» также увеличивают сложность. Аниме с рейтингом выше 8.0 считается более сложным.

Создание столбца difficulty: Применяем функцию calculate_difficulty к каждой строке датасета.

Топ-10 сложных аниме: Сортируем аниме по столбцу difficulty и выбираем первые 10 строк.

Гистограмма: Используем горизонтальную гистограмму (barh) для визуализации топ-10 сложных аниме. Названия аниме отображаются по оси Y, а сложность — по оси X.

0

ВЫВОДЫ/; (結論); /

Исследование подтвердило, что аниме может быть эффективным инструментом для изучения японского языка, особенно при грамотном выборе тайтлов, соответствующих уровню владения языком.

Заключение Аниме действительно может стать полезным инструментом для изучения японского языка, если подходить к его выбору осознанно. Новичкам стоит начинать с простых диалоговых аниме, постепенно переходя к более сложным. Однако следует помнить, что аниме-язык не всегда соответствует реальной речи, поэтому его стоит дополнять другими методами изучения, например, чтением текстов и прослушиванием живых разговоров.

Изучение японского через аниме работает и может быть эффективным методом, если учитывать уровень сложности, особенности жанра и степень соответствия реальному японскому языку.

Диаграммы/графики были написаны с промтами с помощью версии 5.0 ChatGPT и DeepSeek

Обложка для проекта была сделана с помощью нейронной сети Leonardo Ai, Model/Preset — Anime, Style — Anime Retro промт: Retro anime VHS style with a vintage feel, featuring a pixelated aesthetic and neon highlights. The cover should show a VHS tape with a screen showing a retro anime-style illustration of a character studying Japanese, with kanji characters in the background. Use warm, vintage colors like faded yellow, dusty pink, and turquoise, with subtle glitch effects to evoke nostalgia. The design should be simple, bold, and eye-catching, evoking the essence of old-school anime covers.

Аниме и японский язык
5
We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more