Сучасна диджитал-освіта для дітей — безоплатне заняття в GoITeens ×
Mazda CX 5
×

Як працювати з csv файлом в Pandas в Jupiter Notebook?

Друзі, допоможіть будь ласка порадою/ами.
Нещодавно почав освоювати бібліотеку Pandas. Працюю в Jupiter Notebook але чомусь файл csv не зчитується. Я пробував декілька варіантів -все марно.
Куди покласти файл csv щоб Pandas могла його зчитувати?

Спочатку я пробував банально:

import pandas as pd 
df = pd.read_csv("autos.csv")

пише що помилка

потім пробував ось так:

import pandas as pd 
df = pd.read_csv("С://users/Анатолий/Загрузки/train.csv")

FileNotFoundError                         Traceback (most recent call last)
<ipython-input-4-0eafe49cfb48> in <module>()
      1 import pandas as pd
----> 2 df = pd.read_csv("С://users/Анатолий/Загрузки/train.csv")

D:\Anaconda\lib\site-packages\pandas\io\parsers.py in parser_f(filepath_or_buffer, sep, delimiter, header, names, index_col, usecols, squeeze, prefix, mangle_dupe_cols, dtype, engine, converters, true_values, false_values, skipinitialspace, skiprows, nrows, na_values, keep_default_na, na_filter, verbose, skip_blank_lines, parse_dates, infer_datetime_format, keep_date_col, date_parser, dayfirst, iterator, chunksize, compression, thousands, decimal, lineterminator, quotechar, quoting, escapechar, comment, encoding, dialect, tupleize_cols, error_bad_lines, warn_bad_lines, skipfooter, doublequote, delim_whitespace, low_memory, memory_map, float_precision)
    676                     skip_blank_lines=skip_blank_lines).

Дякую

👍ПодобаєтьсяСподобалось0
До обраногоВ обраному0
LinkedIn
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter

треба просто прописати шлях до файлу, відносно місця Jupyter Notebook. І пора перейти на LInux.

Попробуй так

df = pd.read_csv(r"С://users/Анатолий/Загрузки/train.csv",engine="python")

Попробуй так

df = pd.read_csv(r"С://users/Анатолий/Загрузки/train.csv")

У вас ошибка связанная с тем, что скорее всего ноутбук и файл цсв в разных местах

А куди саме тоді покласти файл цсв?

В туже локацию где и цсв. Попробуйте сложить оба файла в папку где нет пути с киррилицей

Заздалегіль прошу вибачання за тупість :)
Ви б не могли детальніше пояснити ))) Бо я це вже робив — нічого не вийшло)

Все нормально.
1) Положите оба файла (.ipynb и .csv) допустим в «C:\test»
2) Выключите шелл ноутбука и включите его снова уже из нового места
3) Должно работать

Я створив окрему папку, куди поклав два файли. Результат той самий.
На жаль

проверьте на то, чтобы вы не спутали кириллические символы и английские

Я Вас правильно зрозумів, для того щоб Pandas прочитав csv файл, треба:

-створити окрему папку в будь-якому місці (наприклад test), назва повинна бути англійською мовою. В папку test покласти файл ipynb, в якому я буду власне відкривати csv файл (наприклад autos) та в цю ж папку покласти потрібний csv файл.

Потім відкрити заново Юпітер Ноутбук, відкрити файл ipynb в якому я збираюся працювати та набрати ось такий код
import pandas as pd
df = pd.read_csv (’autos’)

Все вірно?

да, только расширение файла, также, надо указать

ОСЬ ТАК
import pandas as pd
df = pd.read_csv(’data.csv’) ?

Антон. Все вийшло. Дуже дякую Вам!!!!!!!!!!

Доброго дня. З попереднім файлом все працює супер. А як я зробив те ж саме з іншими — не працює — пише те ж саме, що й з попереднім.
поясню, щоб не заплутувати.
Я створив нову ipynb ’Train’ - та скачав її, після цього закинув її в папку разом з csv файлом ’Train’.

Потім вмикаю Jupiter і вводжу
import pandas as pd
df = pd.read_csv (’train.csv’)

а в результаті ось це
FileNotFoundError Traceback (most recent call last)
in ()
1 import pandas as pd
----> 2 df = pd.read_csv(’Train.csv’)
3 print (df)

як тільки міняю на інший файл — він відкривається, хоча й зробив одне й теж саме )))

Підкажіть, що цього разу не так? )) Чому він не відкриває його?

Назва файлу в тебе починається з великої літери, а читаєш його з маленької, Pandas є case sensitive.
Спробуй — df = pd.read_csv (’Train.csv’)

Updated: перечитав документацію, нічого про case sensitive не пише але спробувати варто

Я без понятия, очень странно это все. У меня все работает даже по вашему рецепту. :/

Так, дуже дивно. Працює тільки з одним файлом.
Всі інші — не баче. Хоча роблю все те саме, що і з тим, що працює.

Так, дуже дивно. Працює тільки з одним файлом.
Всі інші — не баче. Хоча роблю все те саме, що і з тим, що працює.

там уже вище підказали — зверни увагу на case, тобто на назву файла
для операційної системи, для Python і для Pandas Train.csv, train.csv, і train.Csv це все можуть бути різін файли
перейменуй їх однаково в train.csv, і в програмі теж звертайся до train.csv

Друже, саме так все й робив )) Але все одне працює лише з одним файлом. )))
Я вже не знаю в чому може бути проблема )))

який повний шлях до каталогу?
нема у ньому кириличних букв?
каталог c:\\test ?

От чесно. Все без кириличних букв, все за порадами. Але з одним файлом працює а з ідентичними ні.

От чесно. Все без кириличних букв, все за порадами. Але з одним файлом працює а з ідентичними ні.

було б це на Linux, я би віддебажив командою strace, куда там сам і хто чого читає
до купи, перевірив би file permissions
на Windows я уже 100 років нічого не дебажив
Я би ще глянув на permissions цього файла, чи він взагалі читабельний. Можете його у Notepad відкрити, чи він відкривається?

Ще ось таке спробуй

import pandas as pd
import subprocess
subprocess.call("dir", shell=True)
subprocess.call("chdir", shell=True)
df = pd.read_csv (’train.csv’)

І дай вивід команди dir і chdir сюди

нащо так складно? просто %ls, або перевірити сам файл:

%ls С:\users\Анатолий\Загрузки\train.csv

ну і взагалі %magic

нащо так складно?

чим міг, тим допоміг
jupyter та ipython я тільки збоку бачив

я б ще спробував прочитати файл спочатку в звичайному інтерпретаторі пітону, а потім в ipython, але без notebook. ну і там теж можна робити %dir і т.д.

Спробуй повний шлях до файлу прописати

Підписатись на коментарі