
Цели и задачи исследования

Цель: понять, как характеристики автомобилей (класс, объём двигателя, топливо, трансмиссия и т. д.) связаны с выбросами CO₂.
Задачи: 1. подготовить и очистить данные (co2.csv), 2. провести EDA и визуализации, 3. выявить основные зависимости, 4. попробовать простую модель для прогноза CO₂.
Описание данных


Этот датасет содержит информацию о технических характеристиках автомобилей, расходе топлива и выбросах CO₂. Данные собраны для анализа влияния различных параметров автомобилей на их экологический след и предсказания выбросов CO₂ с помощью моделей регрессии.
Переменные в датасете:
- Make — Производитель автомобиля (строка, object).
- Model — Модель автомобиля (строка, object).
- Vehicle Class — Класс автомобиля (строка, object).
- Engine Size (L) — Объем двигателя в литрах (число, float64).
- Cylinders — Количество цилиндров (число, int64).
- Transmission — Тип трансмиссии (строка, object).
- Fuel Type — Тип топлива (строка, object).
- Fuel Consumption City (L/100 km) — Расход топлива в городе (число, float64).
- Fuel Consumption Hwy (L/100 km) — Расход топлива на шоссе (число, float64).
- Fuel Consumption Comb (L/100 km) — Средний расход топлива (число, float64).
- Fuel Consumption Comb (mpg) — Средний расход топлива в милях на галлон (число, int64).
- CO2 Emissions (g/km) — Выбросы CO₂ в граммах на километр (число, int64).

- Автомобили с объемом двигателя больше 3.0 литров — всего 3 156 моделей. Это подтверждает, что автомобили с мощными двигателями встречаются довольно часто. - Автомобили с выбросами CO2 менее 150 г/км — всего 155 моделей. Это небольшое количество говорит о том, что большинство автомобилей не являются особо экологичными. - Автомобили с механической КПП — 1 185 моделей. Несмотря на популярность автоматической коробки передач, механика все еще встречается. - Автомобили с объемом двигателя более 3.0 литров и выбросами CO2 выше 250 г/км — 2 715 моделей. Подтверждается закономерность: чем больше двигатель, тем выше выбросы. - Дизельные автомобили с расходом в городе меньше 7 л/100 км — 0 моделей. Видимо, в этом наборе данных нет экономичных дизельных машин. - Гибридные автомобили с выбросами CO2 меньше 120 г/км — данных нет, что может означать либо малую представленность гибридов, либо их неэффективность в этой базе.
Визуализация



Выбросы CO2 (целевой признак):
Объем двигателя (предиктор):

Удалено 85 выбросов. Итоговый размер датафрейма: 7300 строк.



Сильная положительная корреляция:
Выбросы CO2 и расход топлива (Fuel Consumption): Чем выше расход топлива, тем больше выбросы CO2 (коэффициенты > 0.9).
Объем двигателя (Engine Size) и выбросы CO2: Мощные автомобили с большим двигателем выделяют больше CO2.
Количество цилиндров (Cylinders) и выбросы CO2: Чем больше цилиндров, тем выше выбросы. Отрицательная корреляция:
Расход топлива (L/100 km) и его аналог в mpg: Чем выше расход топлива в литрах, тем ниже эффективность в mpg (отрицательная корреляция около -1).
Вывод:

- Распределение объема двигателя — показывает, что большинство автомобилей имеют объем двигателя в пределах 1-2 литров. - Распределение выбросов CO2 — демонстрирует, что выбросы CO2 в основном сосредоточены в диапазоне 150-300 г/км. - Распределение расхода топлива в городе — основная масса автомобилей потребляет от 10 до 15 литров на 100 км.

- Типы топлива — бензин (Z) и дизель (D) являются наиболее популярными. - Топ-10 трансмиссий — автоматические коробки передач встречаются чаще, чем механические. - Топ-10 классов автомобилей — компактные, среднеразмерные и внедорожники доминируют в выборке.
Регрессионная модель

Уравнение модели: y = 0.66 + 0.82 * X Метрики качества модели: MAE: 0.23 MSE: 0.10 RMSE: 0.31 R²: 0.9873
Генерация обложки и других дополнительных изображений — Sora. URL: https://openai.com/sora/
Источник данных — kaggle. URL: https://www.kaggle.com