ChatGPT для саморазвития: Освоения программирования, консалтинга и изучения иностранных языков. Алексей Михнин

Читать онлайн.
Название ChatGPT для саморазвития: Освоения программирования, консалтинга и изучения иностранных языков
Автор произведения Алексей Михнин
Жанр
Серия
Издательство
Год выпуска 2023
isbn



Скачать книгу

выполнения этой задачи мы будем использовать библиотеку pandas.

      Приведенный ниже код выполняет предварительную обработку данных и выводит отчет по результатам:

      После выполнения этого кода вы получите отчет о предварительной обработке данных, включая количество удаленных дубликатов и заполненных пропущенных значений. Код также выводит первые 10 строк обработанных данных для предварительного просмотра.

      Учтите, что вам нужно будет заменить 'titanic.csv' на действительный путь к файлу CSV на вашем компьютере или URL-адрес файла, если он доступен онлайн.

      Результат:

      Выполняем все рекомендации Чата и посмотрим смотрим что из этого получилось.

      Внимание:

      Мы заметили, что при каждом ответе ChatGPT повторяется код, который устанавливает библиотеку pandas для работы с табличными данными, и загружает данные из нашего датасета в переменную data. Чтобы избежать повторения этого кода, мы можем поступить следующим образом:

      Пропустить эти строки кода и использовать только код, который расположен ниже.

      Конкретизировать наши запросы, напоминая ChatGPT о том, что библиотека pandas уже установлена, и что файл titanic.csv уже загружен в переменную data.

      Кроме того, мы рекомендуем напоминать ChatGPT о том, какие названия столбцов у нас есть в датасете, и какого они типа. Это поможет нам точнее работать со столбцами в нашем датасете. Для этого мы можем попросить ChatGPT вывести названия столбцов и их типы в одну строку, которую мы сможем скопировать и использовать для конкретизации наших последующих запросов.

      Пользователь:

      Выведи в одну строку название столбцов и тип каждого столбца

      Внимание:

      Мы не указали, какой именно датасет мы должны использовать в данном запросе, потому что мы формируем запрос в текущем чате обсуждения, и ChatGPT будет анализировать предыдущие шаги, чтобы понять, какой датасет мы используем. Однако, если в текущем чате было выполнено много шагов или если есть несколько альтернативных датасетов, то необходимо конкретизировать запрос, указав, какой датасет нужно использовать.

      Чат:

      Для вывода названия столбцов и типа каждого столбца, используйте следующий код:

      Результат:

      Выполняем все рекомендации Чата и посмотрим смотрим что из этого получилось.

      Внимание:

      Как вы заметили, мы пропустили строки кода с импортом библиотеки pandas и загрузкой данных из CSV файла. Мы воспользовались ранее предложенным советом и пропустили эти строки кода, чтобы избежать повторения одних и тех же команд.

      Шаг3 Визуализация и статистический данных

      Для построения различных графиков, которые могут помочь визуализировать и провести статистический анализ данных, мы просим Чат предоставить нам соответствующий код.

      Такой код позволит нам быстро и удобно построить необходимые графики и провести необходимый