Original size 1024x1365

Анализ 97 пород собак

PROTECT STATUS: not protected
8

О проекте

Собака, несомненно, одно из самых преданных домашних животных, которое становится тем самым человеческим «другом» не только благодаря верности, но и высокой обучаемости и когнитивным способностям. При выборе собаки важнейшую роль играет ее порода.

Так как в ближайшем будущем я бы хотела завести собаку, анализ данных о способностях и особенностях содержания разных пород для меня, как и для многих собачников, актуален.

Кроме того, в своем проекте я хотела получить ответы на следующие вопросы: Живут ли большие собаки меньше? Какие породы собак наиболее подходят для семей? Как связана энергичность и обучаемость? Можно ли оценить сложность ухода по размерам собаки?

В своем исследовании я использовала датасет Dog breeds details (Kaggle). Датасет содержит информацию о 97 разных породах собак и их отличительных особенностях, таких как: продолжительность жизни, вес и рост (отдельно для самок и отдельно для самцов), длина шерсти, игривость, обучаемость. Физические данные: рост, вес, продолжительность жизни Поведенческие оценки: семейность, энергичность, обучаемость (шкала 1-5). Всего 23 характеристики.

big
Original size 1820x1024

Сгенерировано с помощью Recraft: closeup: three different dachshunds are sitting in front of the camera, the background is beige.

Для оформления визуализации я вдохновлялась самыми распространенными оттенкам шерсти собак, поэтому использовала фирменную палитру Warm Neutrals:

D8B799,

7B4B3A,

333333,

F4E9D6,

8AC6DF

\+ акцентный цвет Sky-blue. Шрифт: Comfortaa.

Обработка данных

Методы анализа, которые я использовала: Корреляционный анализ Категоризация по размеру (критерии: <10 кг, 10-25 кг, 25-45 кг, >45 кг) Визуализация данных (matplotlib + seaborn)

Я импортировала необходимые мне библиотеки: pandas, numpy, matplotlib.pyplot, seaborn, warnings. Затем считала csv-файл с датасетом.

Я использовала графики разных видов: Bubble Chart (для наглядной контрастности по всем породам), Lollipop Chart (для более очевидных различий в средней продолжительности жизни), Grouped Bar Chart (чтобы одновременно оценить несколько категорий), Scatter plot (выявить идеальное соотношение энергичности и обучаемости), Stacked bar chart.

0

Обработала данные для наиболее удобного анализа: категоризировала собак по размерам, высчитала среднюю продолжительность жизни, средний вес и размер. Создала категорию пригодности к жизни в семье.

Визуализация данных

1. Размер, вес и долголетие (Bubble Chart)

Original size 2492x1588
Original size 2532x1460

Корреляция -0.664 подтверждает гипотезу — большие собаки действительно живут меньше. Мини породы (голубые точки) концентрируются в верхней левой части графика.

2. Топ-10 пород-долгожителей (Lollipop chart)

Original size 2752x1572
Original size 1994x1422

Интересно, что только 2 из 10 долгожителей относятся к мини категории, однако общая корреляция -0.664 показывает, что размер влияет на продолжительность жизни в масштабе всех пород.

3. Пригодность к жизни в семье (Grouped bar chart)

Семейность рассчитывается как среднее трех показателей: отношение к детям, другим собакам и незнакомцам.

Original size 2410x1576
Original size 2266x1382

Средние породы показывают лучшие семейные качества (4.03), превосходя крупные (3.67), гигантские (3.37) и мини породы (3.30).

4. Энергичность vs Обучаемость (Scatter plot)

Этот график помогает найти породы для активных семей. По осям — энергичность и обучаемость, цвет показывает семейность. Красный прямоугольник выделяет 'идеальную зону' — породы с высокими показателями по всем трем критериям. Это практический инструмент для выбора.

Original size 2348x1572
Original size 2414x1274

Пород в 'идеальной зоне': 25 Примеры идеальных пород: - Labrador Retriever - Boxer - Poodle (Miniature) - Cardigan Welsh Corgi - Cocker Spaniel

Идеальная зона (высокая энергичность + высокая обучаемость + семейность) содержит породы, подходящие для активных семей.

5. Уход за собакой (в зависимости от размера) (Stacked bar chart)

Последний график демонстрирует практическую сторону — сложность ухода. Суммируются три показателя: линька, груминг и слюнотечение. Хорошо видно, что с увеличением размера породы растет и суммарный балл ухода: гигантские породы лидируют, за ними идут крупные, затем средние и, наконец, мини.

Original size 2502x1584
Original size 2344x1424

Сложность ухода по размерам (от простого к сложному): Мини: 5.67 балла Средние: 5.95 балла Крупные: 6.06 балла Гиганты: 6.76 балла

Крупные породы требуют наибольшего ухода, мини породы — наименьшего. Это важный фактор при выборе породы.

Описание применения генеративной модели

Обложка для проекта сгенерирована с помощью Recraft (https://www.recraft.ai/project/45d43350-d56e-490e-bdfc-3d52d77df1a7): several dogs different breeds sitting on the white coach. no people on the background.

Анализ 97 пород собак
8
We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more