
О проекте
Собака, несомненно, одно из самых преданных домашних животных, которое становится тем самым человеческим «другом» не только благодаря верности, но и высокой обучаемости и когнитивным способностям. При выборе собаки важнейшую роль играет ее порода.
Так как в ближайшем будущем я бы хотела завести собаку, анализ данных о способностях и особенностях содержания разных пород для меня, как и для многих собачников, актуален.
Кроме того, в своем проекте я хотела получить ответы на следующие вопросы: Живут ли большие собаки меньше? Какие породы собак наиболее подходят для семей? Как связана энергичность и обучаемость? Можно ли оценить сложность ухода по размерам собаки?
В своем исследовании я использовала датасет Dog breeds details (Kaggle). Датасет содержит информацию о 97 разных породах собак и их отличительных особенностях, таких как: продолжительность жизни, вес и рост (отдельно для самок и отдельно для самцов), длина шерсти, игривость, обучаемость. Физические данные: рост, вес, продолжительность жизни Поведенческие оценки: семейность, энергичность, обучаемость (шкала 1-5). Всего 23 характеристики.

Для оформления визуализации я вдохновлялась самыми распространенными оттенкам шерсти собак, поэтому использовала фирменную палитру Warm Neutrals:
Обработка данных
Методы анализа, которые я использовала: Корреляционный анализ Категоризация по размеру (критерии: <10 кг, 10-25 кг, 25-45 кг, >45 кг) Визуализация данных (matplotlib + seaborn)
Я импортировала необходимые мне библиотеки: pandas, numpy, matplotlib.pyplot, seaborn, warnings. Затем считала csv-файл с датасетом.
Я использовала графики разных видов: Bubble Chart (для наглядной контрастности по всем породам), Lollipop Chart (для более очевидных различий в средней продолжительности жизни), Grouped Bar Chart (чтобы одновременно оценить несколько категорий), Scatter plot (выявить идеальное соотношение энергичности и обучаемости), Stacked bar chart.
Визуализация данных
1. Размер, вес и долголетие (Bubble Chart)
Корреляция -0.664 подтверждает гипотезу — большие собаки действительно живут меньше. Мини породы (голубые точки) концентрируются в верхней левой части графика.
2. Топ-10 пород-долгожителей (Lollipop chart)
Интересно, что только 2 из 10 долгожителей относятся к мини категории, однако общая корреляция -0.664 показывает, что размер влияет на продолжительность жизни в масштабе всех пород.
3. Пригодность к жизни в семье (Grouped bar chart)
Семейность рассчитывается как среднее трех показателей: отношение к детям, другим собакам и незнакомцам.
Средние породы показывают лучшие семейные качества (4.03), превосходя крупные (3.67), гигантские (3.37) и мини породы (3.30).
4. Энергичность vs Обучаемость (Scatter plot)
Этот график помогает найти породы для активных семей. По осям — энергичность и обучаемость, цвет показывает семейность. Красный прямоугольник выделяет 'идеальную зону' — породы с высокими показателями по всем трем критериям. Это практический инструмент для выбора.
Пород в 'идеальной зоне': 25 Примеры идеальных пород: - Labrador Retriever - Boxer - Poodle (Miniature) - Cardigan Welsh Corgi - Cocker Spaniel
Идеальная зона (высокая энергичность + высокая обучаемость + семейность) содержит породы, подходящие для активных семей.
5. Уход за собакой (в зависимости от размера) (Stacked bar chart)
Последний график демонстрирует практическую сторону — сложность ухода. Суммируются три показателя: линька, груминг и слюнотечение. Хорошо видно, что с увеличением размера породы растет и суммарный балл ухода: гигантские породы лидируют, за ними идут крупные, затем средние и, наконец, мини.
Сложность ухода по размерам (от простого к сложному): Мини: 5.67 балла Средние: 5.95 балла Крупные: 6.06 балла Гиганты: 6.76 балла
Крупные породы требуют наибольшего ухода, мини породы — наименьшего. Это важный фактор при выборе породы.
Описание применения генеративной модели
Обложка для проекта сгенерирована с помощью Recraft (https://www.recraft.ai/project/45d43350-d56e-490e-bdfc-3d52d77df1a7): several dogs different breeds sitting on the white coach. no people on the background.