Ось так виглядав мій дата сет з самого початку
BZB site SB Money Spent
0 231 695 714 10
1 224 539 527 12
2 262 874 365 12
3 302 445 346 10
4 113 540 342 12
5 123 563 281 12
6 206 581 236 10
7 185 590 170 10
8 196 612 95 0
9 206 642 130 0
10 215 654 150 0
11 230 667 170 0
я хотів передбачити SB
а вийшло
Марія привіт. В мене є таблиця, яка складається 4 колонок (’bzb’, ’site’, ’sb’, ’money’) та 12 строчок.
як і потрібно я роблю наступне:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
dataset.shape
(12, 4)
dataset.head ()
dataset.describe
Далі, я хочу зобразити співзалежність між ’money’ ’sb’
dataset.plot(x=’Money’, y=’sb’, style=’o’)
plt.title(’Money vs Visitors’)
plt.xlabel(’Invest’)
plt.ylabel(’Number of visіtors’)
plt.show()
Я хочу передбачити кількість відвідучів (column ’sb’ по осі у) за н-сумму грошей по осі х
Підготовка даних.
Так як attributes зберігаються в змінній Х, то я визначаю її як (-1) як номер колонки ’money’ яка є в моєму дата сеті
а змінна У містить labels і її я власне і шукаю це четверта колонка ’sb’
X = dataset.iloc[:, :-1].values
y = dataset.iloc[:, 4].values
Тепер в нас є attributes labels і нам треба розбити дані на тренувальні та тестові
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=0)
навчаємо алгоритм
from sklearn.linear_model import LinearRegression
regressor = LinearRegression()
regressor.fit(X_train, y_train)
print(regressor.intercept_)
print(regressor.intercept_)
Вийшло 6.89 та [-0.01311009 −0.00413568 0.01895583]
І тепер я не розумію що це за цифри? ))) що вони означають?
Робимо передбачення:
y_pred = regressor.predict(X_test)
df = pd.DataFrame({’Actual’: y_test, ’Predicted’: y_pred})
df
і я отримав дата фрейм
Actual Predicted
0 10 6.263892
1 0 4.342497
2 12 9.662012
потім запустив ще ось таку штуку
from sklearn import metrics
print(’Mean Absolute Error:’, metrics.mean_absolute_error(y_test, y_pred))
print(’Mean Squared Error:’, metrics.mean_squared_error(y_test, y_pred))
print(’Root Mean Squared Error:’, np.sqrt(metrics.mean_squared_error(y_test, y_pred)))
отримав цифри
Подивіться будь ласка де я припустився помилок? що не правильно? чи правильно я відобразив залежність ’money’ та ’sb’?
передбачити я хотів дані якраз по ’sb’ а порахувало чомусь ’money’
і тут я ще більше застряг )))
Привіт,
Привіт. В мене є таблиця, яка складається 4 колонок (’bzb’, ’site’, ’sb’, ’money’) та 12 строчок.
як і потрібно я роблю наступне:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
dataset.shape
(12, 4)
dataset.head ()
dataset.describe
Далі, я хочу зобразити співзалежність між ’money’ ’sb’
dataset.plot(x=’Money’, y=’sb’, style=’o’)
plt.title(’Money vs Visitors’)
plt.xlabel(’Invest’)
plt.ylabel(’Number of visіtors’)
plt.show()
Я хочу передбачити кількість відвідучів (column ’sb’ по осі у) за н-сумму грошей по осі х
Підготовка даних.
Так як attributes зберігаються в змінній Х, то я визначаю її як (-1) як номер колонки ’money’ яка є в моєму дата сеті
а змінна У містить labels і її я власне і шукаю це четверта колонка ’sb’
X = dataset.iloc[:, :-1].values
y = dataset.iloc[:, 4].values
Тепер в нас є attributes labels і нам треба розбити дані на тренувальні та тестові
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=0)
навчаємо алгоритм
from sklearn.linear_model import LinearRegression
regressor = LinearRegression()
regressor.fit(X_train, y_train)
print(regressor.intercept_)
print(regressor.intercept_)
Вийшло 6.89 та [-0.01311009 −0.00413568 0.01895583]
І тепер я не розумію що це за цифри? ))) що вони означають?
Робимо передбачення:
y_pred = regressor.predict(X_test)
df = pd.DataFrame({’Actual’: y_test, ’Predicted’: y_pred})
df
і я отримав дата фрейм
Actual Predicted
0 10 6.263892
1 0 4.342497
2 12 9.662012
потім запустив ще ось таку штуку
from sklearn import metrics
print(’Mean Absolute Error:’, metrics.mean_absolute_error(y_test, y_pred))
print(’Mean Squared Error:’, metrics.mean_squared_error(y_test, y_pred))
print(’Root Mean Squared Error:’, np.sqrt(metrics.mean_squared_error(y_test, y_pred)))
отримав цифри
Подивіться будь ласка де я припустився помилок? що не правильно? чи правильно я відобразив залежність ’money’ та ’sb’?
передбачити я хотів дані якраз по ’sb’ а порахувало чомусь ’money’
і тут я ще більше застряг )))
От чесно. Все без кириличних букв, все за порадами. Але з одним файлом працює а з ідентичними ні.
Друже, саме так все й робив )) Але все одне працює лише з одним файлом. )))
Я вже не знаю в чому може бути проблема )))
Так, дуже дивно. Працює тільки з одним файлом.
Всі інші — не баче. Хоча роблю все те саме, що і з тим, що працює.
Доброго дня. З попереднім файлом все працює супер. А як я зробив те ж саме з іншими — не працює — пише те ж саме, що й з попереднім.
поясню, щоб не заплутувати.
Я створив нову ipynb ’Train’ - та скачав її, після цього закинув її в папку разом з csv файлом ’Train’.
Потім вмикаю Jupiter і вводжу
import pandas as pd
df = pd.read_csv (’train.csv’)
а в результаті ось це
FileNotFoundError Traceback (most recent call last)
in ()
1 import pandas as pd
----> 2 df = pd.read_csv(’Train.csv’)
3 print (df)
як тільки міняю на інший файл — він відкривається, хоча й зробив одне й теж саме )))
Підкажіть, що цього разу не так? )) Чому він не відкриває його?
ОСЬ ТАК
import pandas as pd
df = pd.read_csv(’data.csv’) ?
Я Вас правильно зрозумів, для того щоб Pandas прочитав csv файл, треба:
-створити окрему папку в будь-якому місці (наприклад test), назва повинна бути англійською мовою. В папку test покласти файл ipynb, в якому я буду власне відкривати csv файл (наприклад autos) та в цю ж папку покласти потрібний csv файл.
Потім відкрити заново Юпітер Ноутбук, відкрити файл ipynb в якому я збираюся працювати та набрати ось такий код
import pandas as pd
df = pd.read_csv (’autos’)
Все вірно?
Я створив окрему папку, куди поклав два файли. Результат той самий.
На жаль
Заздалегіль прошу вибачання за тупість :)
Ви б не могли детальніше пояснити ))) Бо я це вже робив — нічого не вийшло)
А куди саме тоді покласти файл цсв?
Друзі, доброго вечору!
Порадьте, будь ласка курси в Києві де можна вивчити Data Science/Machine Learning. Може, хтось відвідував чи чув від знайомих. Може є якійськ позитивні чи навпаки негативні відгуки про навчання в певних школах.
Дуже дякую, наперед!
Гарного вечору!
Дуже дякую!
Дуже дякую!
Всім дуже дякую!
На Анаконді все працює без всяких проблем!
Дуже всім дякую!
Вс запрацювало на Анаконді!
Actual Predicted
0 10 6.263892
1 0 4.342497
2 12 9.662012