10 клас
6 листопада 2020 року
Тема уроку: Основи статистичного аналізу даних.
Вам уже відомо з курсу алгебри 9-го класу, що в багатьох дослідженнях для аналізу даних, установлення певних закономірностей, формулювання висновку, надання рекомендацій, прогнозування тощо потрібно використати багато даних. Ви знаєте, що методи отримання, опрацювання й аналізу даних, які характеризують масові явища, вивчає наука статистика (лат. status — стан).
Так, наприклад, для аналізу тенденцій змінення маси учнів 10-х класів України за останні роки, ризику серцевих захворювань людей певного віку на планеті, популярності продуктів харчування серед населення певного регіону потрібно проаналізувати сотні тисяч або навіть мільйони даних.
Зрозуміло, що провести зважування, вивчити історії хвороб, провести анкетування сотень тисяч або навіть мільйонів людей практично неможливо. Тому для аналізу створюють певну вибірку об’єктів дослідження, тобто з усієї множини об’єктів дослідження відбирають певну кількість і на ній проводять дослідження. Чим більше така вибірка, тим точніше буде проведено аналіз і зроблено відповідні висновки. Тобто вибірка повинна бути масовою.
Але не тільки кількість даних у вибірці визначає рівень точності аналізу і висновків. Так, у першому і другому з наведених вище прикладів доцільно вибирати людей різних регіонів і різної статі, а у третьому — людей різного віку. Кажуть, що вибірка даних має бути репрезентативною (франц. representatif — показовий, характерний, типовий).
Дані, отримані з дослідженої вибірки, найчастіше заносять у таблицю. Така форма подання даних з вибірки зручна для їх аналізу та прогнозів. Дані з кожного рядка і стовпця такої таблиці утворюють ряди даних.
Тенденція — це напрям розвитку, схильність, спрямованість.
Розглянемо кілька прикладів вибірок і рядів даних.
У таблиці подано результати виступів команди учнів України на міжнародних олімпіадах з інформатики з 2005 по 2017 рік. Тут вибіркою є вказані в таблиці роки, а рядами даних — загальна кількість медалей у ці роки, а також кількість золотих, срібних і бронзових медалей у вказані роки.
Зауважимо, що Україна бере участь у таких олімпіадах, починаючи з 1992 року. Команда кожної країни складається із чотирьох учнів. У 2016 році команда України не брала участі у такій олімпіаді.
За цими рядами даних або за деякими з них можна побудувати графіки або діаграми і візуалізувати їх, використовуючи, наприклад, табличний процесор.
Результати виступу команди учнів України на міжнародних олімпіадах з інформатики за 2005–2017 роки
На малюнку подано діаграму динаміки посівних площ соняшнику в Україні в 1998–2015 роках і графік врожайності соняшнику в Україні за ці роки. Тут вибіркою є 2005–2017 роки, а рядами даних — посівні площі та врожайність соняшнику в ці роки.
Як приклад розглянемо роботу синоптичної служби. Синоптична служба збирає і зберігає дані про температуру, опади, атмосферний тиск та інші показники вже понад 160 років.
Для прогнозування температури та ймовірності опадів у Львові в першій декаді червня наступного року для проведення екскурсії потрібно вибрати відповідні дані, наприклад, за останні 10–15 років саме про Львів і саме про першу декаду червня, проаналізувати отримані два ряди даних (про температуру і кількість опадів) і зробити відповідний прогноз погоди.
ДЕЯКІ СТАТИСТИЧНІ ХАРАКТЕРИСТИКИ РЯДУ ДАНИХ|
Розглянемо деякі статистичні характеристики ряду даних: середнє арифметичне. стандартне відхилення, мода і медіана.
Ви знаєте, що середнім арифметичним n чисел називається сума цих чисел, поділена на число n.
Так можна знайти середнє арифметичне врожайності соняшнику в Україні за 2006-2015 роки, використовуючи, наприклад, табличний процесор. Для обчислення середнього арифметичного в табличному процесорі можна використати відому вам функцію AVERAGE (англ. avеragе — середній), Нагадаємо, що аргументами цієї функції може бути діапазон клітинок, список клітинок, а також їх комбінації,наприклад AVERAGE(B2:D5; F4; E7). На малюнку 2,8 наведено приклад обчислення середньої врод-кайності соняшнику за 2006-2015 роки і формулу для її обчислення =AVERAGE(C3:C12).
Обчислене в наведеному прикладі середнє арифметичне визначає,яка б була врожайність кожного року (1.67 T/ra), якшо вона щороку була б однаковою. Аналогічно середнє арифметичне будь-якого ряду даних визначає, які б були значення в цьому ряді, якщо б вони всі були однакові. Зазначимо, що не для всіх рядів даних середнє арифметичне є показовою характеристикою самого цього ряду.
Обчислення середньої врожайності соняшнику за 2006-2015 роки
Наприклад, для ряду даних 2.5; 2.8; 2.3; 2.55; 2.47, у якому дані незначно відрізняються одне від одного, середнє арифметичне дорівнює 2.524, що незначно відрізняється від усіх членів цього ряду, а значить, достатньо показово характеризує весь цей ряд даних. А для ряду 4.7; 6.2; 5.1; 12.4; 14.1, у якому дані значно відрізняються одне від одного, середнє арифметичне дорівнює 8,5, що значно відрізняється від усіх членів цього ряду, а значить, недостатньо показово характеризує весь цей ряд даних.
Для визначення, наскільки показово середнє арифметичне ряду даних характеризує весь ряд даних, можна використати таку характеристику ряду даних, як стандартне відхилення. Стандартно відхилення характеризує, наскільки широко розташовані значення ряду даних відносно їх середнього арифметичного.
Перегляньте матеріал за ІТ-книгою, з якою ми працюємо на уроках, натиснувши тут, та доповніть свій конспект.
Прочитайте матеріал підручника - ст.42-47
Виконайте тестові завдання:
Коментарі
Дописати коментар