• Лінійна Регресія Sklearn! Help

    Actual Predicted
    0 10 6.263892
    1 0 4.342497
    2 12 9.662012

  • Лінійна Регресія Sklearn! Help

    Ось так виглядав мій дата сет з самого початку

    BZB site SB Money Spent
    0 231 695 714 10
    1 224 539 527 12
    2 262 874 365 12
    3 302 445 346 10
    4 113 540 342 12
    5 123 563 281 12
    6 206 581 236 10
    7 185 590 170 10
    8 196 612 95 0
    9 206 642 130 0
    10 215 654 150 0
    11 230 667 170 0

    я хотів передбачити SB
    а вийшло

  • Лінійна Регресія Sklearn! Help

    Марія привіт. В мене є таблиця, яка складається 4 колонок (’bzb’, ’site’, ’sb’, ’money’) та 12 строчок.
    як і потрібно я роблю наступне:
    import pandas as pd
    import numpy as np
    import matplotlib.pyplot as plt
    %matplotlib inline

    dataset.shape
    (12, 4)

    dataset.head ()
    dataset.describe

    Далі, я хочу зобразити співзалежність між ’money’ ’sb’

    dataset.plot(x=’Money’, y=’sb’, style=’o’)
    plt.title(’Money vs Visitors’)
    plt.xlabel(’Invest’)
    plt.ylabel(’Number of visіtors’)
    plt.show()

    Я хочу передбачити кількість відвідучів (column ’sb’ по осі у) за н-сумму грошей по осі х

    Підготовка даних.
    Так як attributes зберігаються в змінній Х, то я визначаю її як (-1) як номер колонки ’money’ яка є в моєму дата сеті

    а змінна У містить labels і її я власне і шукаю це четверта колонка ’sb’

    X = dataset.iloc[:, :-1].values
    y = dataset.iloc[:, 4].values
    Тепер в нас є attributes labels і нам треба розбити дані на тренувальні та тестові

    from sklearn.model_selection import train_test_split
    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=0)

    навчаємо алгоритм

    from sklearn.linear_model import LinearRegression
    regressor = LinearRegression()
    regressor.fit(X_train, y_train)
    print(regressor.intercept_)
    print(regressor.intercept_)

    Вийшло 6.89 та [-0.01311009 −0.00413568 0.01895583]

    І тепер я не розумію що це за цифри? ))) що вони означають?

    Робимо передбачення:
    y_pred = regressor.predict(X_test)
    df = pd.DataFrame({’Actual’: y_test, ’Predicted’: y_pred})
    df

    і я отримав дата фрейм
    Actual Predicted
    0 10 6.263892
    1 0 4.342497
    2 12 9.662012

    потім запустив ще ось таку штуку
    from sklearn import metrics
    print(’Mean Absolute Error:’, metrics.mean_absolute_error(y_test, y_pred))
    print(’Mean Squared Error:’, metrics.mean_squared_error(y_test, y_pred))
    print(’Root Mean Squared Error:’, np.sqrt(metrics.mean_squared_error(y_test, y_pred)))

    отримав цифри

    Подивіться будь ласка де я припустився помилок? що не правильно? чи правильно я відобразив залежність ’money’ та ’sb’?
    передбачити я хотів дані якраз по ’sb’ а порахувало чомусь ’money’

    і тут я ще більше застряг )))

  • Лінійна Регресія Sklearn! Help

  • Лінійна Регресія Sklearn! Help

    Привіт. В мене є таблиця, яка складається 4 колонок (’bzb’, ’site’, ’sb’, ’money’) та 12 строчок.
    як і потрібно я роблю наступне:
    import pandas as pd
    import numpy as np
    import matplotlib.pyplot as plt
    %matplotlib inline

    dataset.shape
    (12, 4)

    dataset.head ()
    dataset.describe

    Далі, я хочу зобразити співзалежність між ’money’ ’sb’

    dataset.plot(x=’Money’, y=’sb’, style=’o’)
    plt.title(’Money vs Visitors’)
    plt.xlabel(’Invest’)
    plt.ylabel(’Number of visіtors’)
    plt.show()

    Я хочу передбачити кількість відвідучів (column ’sb’ по осі у) за н-сумму грошей по осі х

    Підготовка даних.
    Так як attributes зберігаються в змінній Х, то я визначаю її як (-1) як номер колонки ’money’ яка є в моєму дата сеті

    а змінна У містить labels і її я власне і шукаю це четверта колонка ’sb’

    X = dataset.iloc[:, :-1].values
    y = dataset.iloc[:, 4].values
    Тепер в нас є attributes labels і нам треба розбити дані на тренувальні та тестові

    from sklearn.model_selection import train_test_split
    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=0)

    навчаємо алгоритм

    from sklearn.linear_model import LinearRegression
    regressor = LinearRegression()
    regressor.fit(X_train, y_train)
    print(regressor.intercept_)
    print(regressor.intercept_)

    Вийшло 6.89 та [-0.01311009 −0.00413568 0.01895583]

    І тепер я не розумію що це за цифри? ))) що вони означають?

    Робимо передбачення:
    y_pred = regressor.predict(X_test)
    df = pd.DataFrame({’Actual’: y_test, ’Predicted’: y_pred})
    df

    і я отримав дата фрейм
    Actual Predicted
    0 10 6.263892
    1 0 4.342497
    2 12 9.662012

    потім запустив ще ось таку штуку
    from sklearn import metrics
    print(’Mean Absolute Error:’, metrics.mean_absolute_error(y_test, y_pred))
    print(’Mean Squared Error:’, metrics.mean_squared_error(y_test, y_pred))
    print(’Root Mean Squared Error:’, np.sqrt(metrics.mean_squared_error(y_test, y_pred)))

    отримав цифри

    Подивіться будь ласка де я припустився помилок? що не правильно? чи правильно я відобразив залежність ’money’ та ’sb’?
    передбачити я хотів дані якраз по ’sb’ а порахувало чомусь ’money’

    і тут я ще більше застряг )))

  • Як працювати з csv файлом в Pandas в Jupiter Notebook?

    От чесно. Все без кириличних букв, все за порадами. Але з одним файлом працює а з ідентичними ні.

  • Як працювати з csv файлом в Pandas в Jupiter Notebook?

    Друже, саме так все й робив )) Але все одне працює лише з одним файлом. )))
    Я вже не знаю в чому може бути проблема )))

  • Як працювати з csv файлом в Pandas в Jupiter Notebook?

    Так, дуже дивно. Працює тільки з одним файлом.
    Всі інші — не баче. Хоча роблю все те саме, що і з тим, що працює.

  • Як працювати з csv файлом в Pandas в Jupiter Notebook?

    Доброго дня. З попереднім файлом все працює супер. А як я зробив те ж саме з іншими — не працює — пише те ж саме, що й з попереднім.
    поясню, щоб не заплутувати.
    Я створив нову ipynb ’Train’ - та скачав її, після цього закинув її в папку разом з csv файлом ’Train’.

    Потім вмикаю Jupiter і вводжу
    import pandas as pd
    df = pd.read_csv (’train.csv’)

    а в результаті ось це
    FileNotFoundError Traceback (most recent call last)
    in ()
    1 import pandas as pd
    ----> 2 df = pd.read_csv(’Train.csv’)
    3 print (df)

    як тільки міняю на інший файл — він відкривається, хоча й зробив одне й теж саме )))

    Підкажіть, що цього разу не так? )) Чому він не відкриває його?

  • Як працювати з csv файлом в Pandas в Jupiter Notebook?

    Антон. Все вийшло. Дуже дякую Вам!!!!!!!!!!

    Поддержал: Anton Fimin
  • Як працювати з csv файлом в Pandas в Jupiter Notebook?

    ОСЬ ТАК
    import pandas as pd
    df = pd.read_csv(’data.csv’) ?

  • Як працювати з csv файлом в Pandas в Jupiter Notebook?

    Я Вас правильно зрозумів, для того щоб Pandas прочитав csv файл, треба:

    -створити окрему папку в будь-якому місці (наприклад test), назва повинна бути англійською мовою. В папку test покласти файл ipynb, в якому я буду власне відкривати csv файл (наприклад autos) та в цю ж папку покласти потрібний csv файл.

    Потім відкрити заново Юпітер Ноутбук, відкрити файл ipynb в якому я збираюся працювати та набрати ось такий код
    import pandas as pd
    df = pd.read_csv (’autos’)

    Все вірно?

  • Як працювати з csv файлом в Pandas в Jupiter Notebook?

    Я створив окрему папку, куди поклав два файли. Результат той самий.
    На жаль

  • Як працювати з csv файлом в Pandas в Jupiter Notebook?

    Заздалегіль прошу вибачання за тупість :)
    Ви б не могли детальніше пояснити ))) Бо я це вже робив — нічого не вийшло)

  • Як працювати з csv файлом в Pandas в Jupiter Notebook?

    А куди саме тоді покласти файл цсв?

  • Навчання data science/machine learning

    Друзі, доброго вечору!
    Порадьте, будь ласка курси в Києві де можна вивчити Data Science/Machine Learning. Може, хтось відвідував чи чув від знайомих. Може є якійськ позитивні чи навпаки негативні відгуки про навчання в певних школах.

    Дуже дякую, наперед!
    Гарного вечору!

    Поддержал: Anastasiia Neviantseva
  • Навчання data science/machine learning

    Дуже дякую!

  • Навчання data science/machine learning

    Дуже дякую!

  • Установка бібліотек Numpy, Scipy на Python 3.6 (32 біт)

    Всім дуже дякую!
    На Анаконді все працює без всяких проблем!

    Поддержали: Anatoliy Sova, minodvesP Vasya
  • Установка бібліотек Numpy, Scipy на Python 3.6 (32 біт)

    Дуже всім дякую!
    Вс запрацювало на Анаконді!

← Сtrl 12 Ctrl →