Original size 1973x2770

Анализ индийской кухни

PROTECT STATUS: not protected
3
big
Original size 2160x696

ИНДИЙСКАЯ КУХНЯ

Индийская культура всегда вызывала у меня интерес, особенно её кулинарные традиции, которые отражают богатство и разнообразие страны. Чтобы глубже изучить эту тему, я решила проанализировать датасет, посвящённый индийской кухне. Моя цель — исследовать состав блюд, выявить популярные ингредиенты и их сочетания, а также понять, как региональные особенности влияют на вкусовые профили. Этот анализ позволит не только систематизировать знания об индийской кухне, но и сделать практические выводы, которые могут быть полезны для любителей кулинарии и культурных исследований.

ЭСТЕТИКА

Мой интерес к индийской кухне не только теоретический, но и личный. В детстве я провела два месяца в Индии, и это время оставило яркие воспоминания, особенно связанные с местной едой. Я до сих пор помню вкус бананового и мангового ласси, а также множество других блюд, которые поразили меня своим разнообразием и насыщенностью вкусов. Этот опыт вдохновил меня на более глубокое изучение индийской кулинарной культуры через анализ датасета. Датасет я нашла на сайте Kaggle.

big
Original size 2160x1208

Мудборд

big
Original size 2160x696

Палитра

Чтобы передать атмосферу и эстетику, которую я ассоциирую с Индией, я решила оформить визуализации в тёплой цветовой палитре, напоминающей о специях, солнце и традиционных тканях. На графики я наложила текстуры, имитирующие пергамент, ткань и другие натуральные материалы, чтобы добавить аутентичности и визуальной глубины. Для текста был выбран шрифт Alegreya, который, на мой взгляд, идеально сочетает в себе восточную эстетику и современную лаконичность. Его поддержка как латиницы, так и кириллицы делает его универсальным инструментом для оформления.

Original size 2160x852

НАЧАЛО КОДА!

Я начала с установки необходимых библиотек, таких как pandas, matplotlib, seaborn и wordcloud, чтобы обеспечить инструменты для анализа и визуализации данных. Затем я импортировала эти библиотеки и настроила пользовательский шрифт Alegreya. По ходу работы шрифт не хотел устанавливаться, поэтому я обратилась к DeepSeek с просьбой «исправить код для шрифта», и он заработал.

После этого я загрузила датасет indian_food.csv и провела предварительную обработку данных, заменив пропущенные значения и удалив строки с отсутствующими ключевыми данными. Я также отфильтровала данные, чтобы сосредоточиться на релевантной информации, исключив ненужные регионы и значения, так как заметила в выбранном мной датасете значение «-1» во многих строчках.

Original size 2160x162
Original size 2160x875
Original size 2160x479

ПОПУЛЯРНОСТЬ ВЕГЕТАРИАНСТВА

Этот график показывает отношение вегетарианских блюд к невегетарианским. Для визуализации я выбрала круговую диаграмму, так как она отлично подходит для отображения пропорций и позволяет наглядно сравнить доли разных категорий. Я настроила размер графика и цвета, используя заранее определённую палитру new_colors. Также я задала параметры фона, чтобы он был светлым. В коде я начала с очистки данных, удалив строки, где в столбце 'diet' указано значение '-1', чтобы избавиться от некорректных или пропущенных записей (для точности анализа). Затем я подсчитала количество блюд для каждого типа диеты с помощью метода value_counts (), чтобы понять, сколько блюд являются вегетарианскими, а сколько — нет.

Original size 2160x462
Original size 3004x3160

Круговая диаграмма

В итоге, график наглядно показывает, что вегетарианские блюда занимают большую часть индийской кухни, что соответствует культурным и религиозным традициям Индии. Из почти трёх сотен только около 40 блюд являются мясными. Вот некоторые из них: Курица Тикка — готовится согласно данным около трёх часов в качестве первого блюда. В готовке используется курица, цельнозерновой хлеб, рисовая мука, порошок гарам масала, цельное яйцо. Колим Джавла — рыбное блюдо, основное, в готовке используется баинган, рыба, кокосовое масло, свежий кокос, имбирь.

ВЕГЕТАРИАНСТВО В РАЗЛИЧНЫХ РЕГИОНАХ

Я решила использовать столбчатую диаграмму с накоплением для визуализации распределения вегетарианских и невегетарианских блюд по регионам, так как этот тип графика позволяет наглядно сравнить доли разных категорий в рамках каждого региона.

В коде я начала с настройки параметров графика, задав размер фигуры и цвет фона, чтобы визуализация выглядела гармонично. Затем я использовала библиотеку seaborn для создания столбчатой диаграммы с накоплением. Для этого я разделила данные на две части: невегетарианские блюда отображаются нижним слоем столбцов, а вегетарианские — верхним, что позволяет сразу увидеть соотношение между ними в каждом регионе. Цвета для столбцов я выбрала из заранее определённой палитры.Также я попросила DeepSeek «убрать лишние линии» с помощью sns.despine () и «настроить отступы, чтобы график выглядел аккуратно.»

Original size 2160x525
Original size 4096x2028

Стобчатая диаграмма с накоплением

На основе этой визуализации можно сделать вывод, что вегетарианские блюда преобладают в большинстве регионов Индии, что отражает культурные и религиозные традиции страны, что уже было выявлено выше. Однако в некоторых регионах доля невегетарианских блюд значительно выше, что может быть связано с преобладанием других религий, таких как христианство, или, например, буддизм (которые на самом деле очень мало распространены в отличие от индуизма и ислама).

ОБЛАКО ВСЕХ ИНГРЕДИЕНТОВ

Далее я выбрала облако слов для визуализации наиболее часто используемых ингредиентов в индийской кухне, так как этот тип графика позволяет наглядно отобразить популярность ингредиентов через их размер. Мне этот вид визуализации нравится больше всех.

В коде я начала с объединения всех ингредиентов из датасета в одну строку, чтобы затем подсчитать частоту их использования с помощью Counter. Это позволило мне создать словарь, где ключами являются ингредиенты, а значениями — их количество. Затем я использовала библиотеку WordCloud для создания облака слов, настроив его размер, цвет фона и цветовую схему. Я выбрала цветовую палитру «plasma», т. к. она наиболее совместима цветами с моей изначальной палитрой.

Для отображения облака слов я использовала matplotlib, задав размер фигуры и убрав оси, чтобы сосредоточить внимание на визуализации.

Original size 2160x379
Original size 1900x1046

Облако слов

Как видно по облаку, индийцы особенно часто используют сахар и имбирь при готовке. По данным датасета также очевидно, что вкусовой профиль у большинства блюд — острый и сладкий. Также есть и другие популярные ингредиенты, например, Гарам масала, смесь особых специй, широко применяется в кулинарии. Гхи можно считать просто топлёным маслом. А Урад Дал — крупа, по-другому — чёрный маш.

Наиболее интересные замеченные мной ингредиенты — банановый цветок, африканское просо, масло сосны Кевра.

ВРЕМЯ ПРИГОТОВЛЕНИЯ БЛЮДА

График с заливкой, по-моему, больше всего подходит для визуализации среднего времени приготовления блюд по их типу, так как на нём заметнее всего изменения во времени, рост и падение от одного типа блюда к другому.

В коде я начала с очистки данных, удалив строки, где в столбцах 'course' и 'cook_time' указано значение '-1', чтобы исключить некорректные или пропущенные записи. Затем я преобразовала значения времени приготовления в числовой формат и удалила строки с отсутствующими значениями, чтобы обеспечить точность анализа. После этого я сгруппировала данные по типу блюда и рассчитала среднее время приготовления для каждой категории.

Original size 2160x929
Original size 2378x1580

График с заливкой

На основе графика можно сделать вывод, что среднее время готовки — 30 — 50 минут. Дольше всего готовятся десерты, что лично для меня удивительно. На закуски же тратится меньше всего сил и времени. Прошерстив датасет, я нашла десерт со смешным названием, который готовится час — Бебинка. Это традиционный десерт из Гоа, являющийся слоёным пирогом, оригинальный рецепт которого принадлежит португальскому миссионеру по имени Бебиана из монастыря Санта-Марта в Гоа. Бебиана включил в рецепт желтки, и добавил ингредиенты и методы, используемые в Гоа. Например, мускатный орех и кокосовое масло, а также технику приготовления в глиняных горшках.

ПРЕОБЛАДАЮЩИЕ ВКУСЫ В РЕГИОНАХ

Следующий график представлен в виде простой столбчатой диаграммы.

В коде я начала с очистки данных, удалив строки, где в столбцах 'region' и 'flavor_profile' указано значение '-1', чтобы исключить некорректные или пропущенные записи. Затем я определила количество уникальных вкусовых профилей, чтобы правильно настроить цветовую палитру для графика.

Original size 2160x800
Original size 4096x2716

Столбчатая диаграмма

Понятно, что преобладающими вкусовыми профилями так и останутся острый и сладкий, поскольку это всё-таки Индия. Разнообразие блюд больше всего на Западе Индии, и так же только там есть блюдо с основным непривычным для индийцев вкусом — кислым. Манго Рас, или Кери Рас, основное блюдо, из ингредиентов только манго и сахар, больше походит на десерт, по-моему мнению. Но согласно описанию, его подают вприкуску с овощами и хлебом.

ПОДГОТОВКА И ПРИГОТОВКА БЛЮДА

Последний график — тепловая карта, на которой представлены средние значения как самой готовки блюд, так и приготовления (обработка, чистка продуктов и т. д.) по отношению к типу блюда.

С последним графиком было больше всего хлопот, потому что шрифт никак не хотел импортироваться, поэтому я попросила DeepSeek «переписать мой код так, чтобы код импортировался без проблем.» Пришлось заново устанавливать библиотеки, затем я перешла к тепловой карте. В коде я начала с очистки данных, удалив строки, где в столбцах 'course', 'prep_time' и 'cook_time' указано значение '-1', чтобы исключить некорректные или пропущенные записи. Затем я сгруппировала данные по типу блюда и рассчитала среднее время приготовления и подготовки для каждой категории. Это позволило мне создать матрицу, где строки представляют типы блюд, а столбцы — время подготовки и приготовления. Для визуализации я использовала библиотеку seaborn, создав тепловую карту с аннотациями, которые показывают точные значения времени.

Original size 2160x1753
Original size 3612x2356

Тепловая карта

Как понятно из таблицы, подготовка от приготовки мало чем отличается, если дело касается времени. Статистически, почти все категории блюд требуют плюс минус одинакового количества минут, однако счётчик подсбили «первые блюда», подготовка которых требует в среднем аж три часа. Я думаю, скорее всего это невегетарианские блюда, так как подготовка мяса занимает много времени. И да, всё верно! Это вышеупомянутая Курица Тикка! И в плюс к ней идёт блюдо Рыба Тикка! И входит в него мука из нута, порошок бирьяни масала, йогурт, филе рыбы, зеленый болгарский перец.

КОД И ДАТАСЕТ

СПИСОК ИСТОЧНИКОВ

Kaggle — https://www.kaggle.com/ Stable Diffusion 3 (для генерации обложки. промт: Indian culture, ethnic vibe, food items on a picnic, bright sun, flatbreads, bananas, fruits, various traditional Indian dishes.) https://stabledifffusion.com/stable-diffusion-3-medium DeepSeek — https://www.deepseek.com/

Original size 2160x696
Анализ индийской кухни
3
We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more