new ΑΚΑΔΗΜΑΪΚΟ ΕΤΟΣ 2019 - 2020 · 2020. 8. 26. · (α) ανίγραφο ης...

28
Θ.Ε. ΔΙΠ 50: Εργασία 4 (2019-20) Σελίδα 1 από 28 ΑΚΑΔΗΜΑΪΚΟ ΕΤΟΣ 2019 - 2020 ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΔΙΑΧΕΙΡΙΣΗ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑ ΠΟΙΟΤΗΤΑΣ ΘΕΜΑΤΙΚΗ ΕΝΟΤΗΤΑ Βασικά Εργαλεία και Μέθοδοι για τον Έλεγχο της Ποιότητας [ΔΙΠ 50] 4η ΓΡΑΠΤΗ ΕΡΓΑΣΙΑ Προσοχή: Η καταληκτική ημερομηνία υποβολής της Γραπτής Εργασίας είναι η Τετάρτη, 25/3/2020, ώρα 23:59

Upload: others

Post on 22-Oct-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

  • Θ.Ε. ΔΙΠ 50: Εργασία 4 (2019-20) Σελίδα 1 από 28

    ΑΚΑΔΗΜΑΪΚΟ ΕΤΟΣ 2019 - 2020

    ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ

    ΔΙΑΧΕΙΡΙΣΗ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑ ΠΟΙΟΤΗΤΑΣ

    ΘΕΜΑΤΙΚΗ ΕΝΟΤΗΤΑ

    Βασικά Εργαλεία και Μέθοδοι για τον Έλεγχο της Ποιότητας [ΔΙΠ 50]

    4η ΓΡΑΠΤΗ ΕΡΓΑΣΙΑ

    Προσοχή: Η καταληκτική ημερομηνία υποβολής της Γραπτής Εργασίας είναι η

    Τετάρτη, 25/3/2020, ώρα 23:59

  • Θ.Ε. ΔΙΠ 50: Εργασία 4 (2019-20) Σελίδα 2 από 28

    ΟΔΗΓΙΕΣ ΓΙΑ ΤΗΝ ΕΚΠΟΝΗΣΗ ΓΡΑΠΤΩΝ ΕΡΓΑΣΙΩΝ ΣΤΗ ΘΕ ΔΙΠ 50

    1. Κατά τη διάρκεια του ακαδημαϊκού έτους δίνονται πέντε (5) γραπτές εργασίες (ΓΕ). Κάθε ΓΕ βαθμολογείται στην κλίμακα 0-10. Για να κατοχυρώσετε δικαίωμα συμμετοχής στις εξετάσεις θα πρέπει να υποβάλετε τουλάχιστον τέσσερις (4) ΓΕ και να συγκεντρώσετε συνολική βαθμολογία τουλάχιστον 25 μονάδων (το δυνητικό άριστα είναι 50 μονάδες).

    2. Κάθε φοιτητής συμπληρώνει το ειδικό «Φύλλο Απαντήσεων» της ΓΕ που είναι ηλεκτρονικό αρχείο docx και το υποβάλλει αποκλειστικά μέσω του Ψηφιακού Χώρου Εκπαίδευσης (study.eap.gr). Συνιστάται η υποβολή του «Φύλλου Απαντήσεων» της ΓΕ και σε ηλεκτρονικό αρχείο μορφής pdf. Άλλοι τύποι ηλεκτρονικών αρχείων (π.χ., jpg), ή χειρόγραφες εργασίες, δεν λαμβάνονται υπόψη.

    3. Πρέπει να τηρείται η προθεσμία υποβολής των ΓΕ επειδή μετά το πέρας της καταληκτικής ημερομηνίας υποβολής κάθε ΓΕ δεν παρέχεται δυνατότητα εκπρόθεσμης υποβολής.

    4. Μην αντιγράφετε τις εκφωνήσεις στο «Φύλλο Απαντήσεων».

    5. Σε κάθε ερώτημα να δίνετε έναν (1) μόνο τρόπο λύσης.

    6. Αν σε ένα ερώτημα χρησιμοποιείτε το στατιστικό πακέτο ΜΙΝΙΤΑΒ, θα πρέπει να περιέχεται οπωσδήποτε στην απάντησή σας:

    (α) αντίγραφο της εκτύπωσης του session window του ΜΙΝΙΤΑΒ και ενδεχομένως σχήματα,

    (β) σχολιασμός ή ερμηνεία του αποτελέσματος του ΜΙΝΙΤΑΒ.

    7. Δεν θα βαθμολογούνται απαντήσεις στις οποίες γίνεται χρήση άλλου στατιστικού πακέτου (εκτός του ΜΙΝΙΤΑΒ). Επιτρέπεται η χρήση του Excel για τη διενέργεια μόνο απλών αριθμητικών υπολογισμών.

    8. Στις προτάσεις τύπου «Σωστή - Λάθος» πρέπει απαραίτητα να γράφετε την επιλογή σας («Σωστή» ή «Λάθος»). Στις προτάσεις που επιλέγετε την απάντηση «Λάθος» να δίνετε σαφή αιτιολόγηση η οποία να περιέχει εντοπισμό του λάθους, και όχι να παραπέμπετε αποκλειστικά σε ολόκληρες παραγράφους ή σελίδες του εκπαιδευτικού υλικού.

    Ομοίως, στα ερωτήματα «Πολλαπλής Επιλογής», πρέπει απαραίτητα να επιλέγετε τη σωστή επιλογή, π.χ. «η επιλογή (ii) είναι η Σωστή» και να αιτιολογείτε με σαφήνεια την επιλογή σας όταν αυτό ζητείται. Αν δεν υπάρχει ξεκάθαρη επιλογή σε μία πρόταση «Σωστή - Λάθος», ή σε ένα ερώτημα «Πολλαπλής Επιλογής», το ερώτημα θα μηδενίζεται.

    9. Στους υπολογισμούς να γίνεται χρήση τεσσάρων δεκαδικών ψηφίων.

    10. Εάν υποβληθούν από δύο ή περισσότερους φοιτητές πανομοιότυπες απαντήσεις σε μια ή περισσότερες ασκήσεις (έστω και με μικροαλλαγές για να φαίνονται δήθεν διαφορετικές), θα μηδενίζονται οι εργασίες όλων των εμπλεκόμενων φοιτητών.

  • Θ.Ε. ΔΙΠ 50: Εργασία 4 (2019-20) Σελίδα 3 από 28

    -

    ΑΣΚΗΣΕΙΣ 4ης ΓΡΑΠΤΗΣ ΕΡΓΑΣΙΑΣ

    Άσκηση 1 (15 μονάδες)

    Δώστε την κατάλληλη απάντηση (ΣΩΣΤΗ ή ΛΑΘΟΣ) στις παραγράφους (α)-(ι). Αιτιολογήστε σύντομα μόνο τις απαντήσεις στις οποίες επιλέξατε ΛΑΘΟΣ.

    (α-1.5) Το πρότυπο 𝑌 = 𝛽0 + 𝛽1𝑥 +𝛽2

    𝑥+ 𝛽3𝑥

    2 + 𝜀 δεν αποτελεί πρότυπο πολλαπλής γραμμικής

    παλινδρόμησης.

    Λάθος. Μπορεί να θεωρηθεί γραμμικό αν ορίσουμε τις προβλέπουσες μεταβλητές 𝑥1 = 𝑥, 𝑥2 =1

    𝑥,

    𝑥3 = 𝑥2 (βλ. σελίδες 141 και 177 του Τόμου Β’).

    Σωστό.

    1 −(𝑛 − 2)𝑠2

    𝑆𝑆𝑇= 1 −

    (𝑛 − 2)𝑆𝑆𝐸

    𝑛 − 2𝑆𝑆𝑇

    = 1 −𝑆𝑆𝐸

    𝑆𝑆𝑇=

    𝑆𝑆𝑇 − 𝑆𝑆𝐸

    𝑆𝑆𝑇=

    𝑆𝑆𝑅

    𝑆𝑆𝑇= 𝑟2

  • Θ.Ε. ΔΙΠ 50: Εργασία 4 (2019-20) Σελίδα 4 από 28

    (γ-1.5) Σε ένα πρότυπο απλής γραμμικής παλινδρόμησης η διασπορά του εκτιμητή ελαχίστων τετραγώνων Β0 είναι πάντοτε μεγαλύτερη από τη διασπορά του εκτιμητή ελαχίστων τετραγώνων Β1). Λάθος. Βλέπε και σελ. 155, σχέσεις (9.34), (9.35).

    𝑣𝑎𝑟(𝛣0) =∑ 𝑥𝑖

    2𝑛𝑖=1

    𝑛∙

    𝜎2

    ∑ (𝑥𝑖 − �̅�)2𝑛𝑖=1

    Όμως:

    𝑣𝑎𝑟(𝛣1) =𝜎2

    ∑ (𝑥𝑖 − �̅�)2𝑛𝑖=1

    Οπότε αν συνδυάσουμε τις 2 παραπάνω σχέσεις έχουμε:

    𝑣𝑎𝑟(𝛣0) =∑ 𝑥𝑖

    2𝑛𝑖=1

    𝑛∙ 𝑣𝑎𝑟(𝛣1)

    Προφανώς θα ισχύει 𝑣𝑎𝑟(𝛣0) > 𝑣𝑎𝑟(𝛣1), αν ∑ 𝑥𝑖

    2𝑛𝑖=1

    𝑛> 1

    ή διαφορετικά ∑ 𝑥𝑖2𝑛

    𝑖=1 > 𝑛, το οποίο δεν ισχύει πάντα.

    Γενικά, ο παράγοντας ∑ 𝑥𝑖

    2𝑛𝑖=1

    𝑛 μπορεί να είναι ίσος με την μονάδα, μεγαλύτερος από την μονάδα ή

    μικρότερος από την μονάδα αν π.χ. όλα τα 𝑥𝑖 = 1, 𝑥𝑖 < 1, 𝑥𝑖 > 1 αντίστοιχα.

    (δ-1.5) Η απουσία συσχέτισης μεταξύ των από κοινού κατανεμημένων τυχαίων μεταβλητών Χ και Υ, σε καμία περίπτωση δεν ισοδυναμεί με ανεξαρτησία των τυχαίων μεταβλητών Χ και Υ. Λάθος. Βλέπε σελίδα 172. Ισχύει μόνο αν το (𝑋, 𝑌) έχει διδιάστατη κανονική κατανομή.

    (ε-1.5) Στην απλή γραμμική παλινδρόμηση το τετράγωνο της τιμής της στατιστικής συνάρτησης t του ελέγχου 𝐻0: 𝛽1 = 0 έναντι 𝐻𝐴: 𝛽1 ≠ 0, ισούται με την τιμή της στατιστικής συνάρτησης του F ελέγχου για τη σημαντικότητα της παλινδρόμησης.

    Σωστό. Έχουμε τον έλεγχο 𝐻0: 𝛽1 = 0 έναντι 𝐻𝐴: 𝛽1 ≠ 0. Όταν ισχύει η 𝐻0 έχουμε:

    𝑡2 = [𝐵1 − 𝛽10

    𝑆(𝐵1)]

    2

    = [𝐵1 − 0

    𝑠[∑ (𝑥𝑖 − �̅�)2

    𝑛𝑖=1 ]

    1/2

    ]

    2

    =𝛣1

    2

    𝑠2

    ∑ (𝑥𝑖 − �̅�)2𝑛𝑖=1

    =𝛣1

    2 ∙ ∑ (𝑥𝑖 − �̅�)2𝑛

    𝑖=1

    𝑠2

    =𝛣1

    2 ∙ ∑ (𝑥𝑖 − �̅�)2𝑛

    𝑖=1

    𝑠2=

    ∑ (�̂�𝑖 − �̅�)2𝑛

    𝑖=1

    𝑠2=

    𝑆𝑆𝑅

    𝑠2= 𝐹

    (στ-1.5) Ο κατασκευαστής ενός πολυμέτρου με κλίμακα μέτρησης 0-150V για τη μέτρηση τάσης, δίνει ακρίβεια ±2%V (f.s.d.). Σε μια μέτρηση τάσης το πολύμετρο δίνει ένδειξη 120V. Η ακρίβεια του πολυμέτρου για τη συγκεκριμένη μέτρηση είναι ±3 V.

    Σωστό. Η ακρίβεια του πολύμετρου για τη συγκεκριμένη μέτρηση είναι πάλι ±2% V. Δηλαδή ±0,02 ∙

    150 = ±3 𝑉 (βλέπε σελίδα 30, Τόμος Γ’)

    (ζ-1.5) Ένας ζυγός χρησιμοποιείται για τη μέτρηση μιας πρότυπης μάζας 1.0Kg. Αν σε 4 διαδοχικές μετρήσεις της πρότυπης μάζας οι ενδείξεις του ζυγού ήταν 1.202 Kg, 1.201 Kg, 1.199 Kg, 1.200 Kg, τότε μπορούμε να πούμε ότι ο ζυγός έχει μεγάλη ορθότητα (accuracy) και μικρή πιστότητα (precision).

  • Θ.Ε. ΔΙΠ 50: Εργασία 4 (2019-20) Σελίδα 5 από 28

    Λάθος. Το ανάποδο. Έχει μικρή ορθότητα και μεγάλη πιστότητα (βλέπε σελίδα 29, Τόμος Γ’)

    (η-1.5) Ένα ωμόμετρο χρησιμοποιείται για τη μέτρηση μιας αντίστασης. Η αντίσταση μετριέται 10 φορές και η μέση τιμή των μετρήσεων είναι 4694Ω με τυπική απόκλιση 20.1Ω. Αν η ένδειξη του ωμομέτρου σε μια μέτρηση (από τις 10) της αντίστασης ήταν 4650Ω, τότε αυτή αποτελεί παρασιτικό σφάλμα.

    Λάθος. Βλέπε σελίδα 49, Τόμος Γ’. Έχουμε:

    𝛿𝑥 = 𝑥 − �̅� = 4650 − 4694 = −44

    3 ∙ 𝑠 = 3 ∙ 20,1 = 60,3

    Αφού |𝛿𝑥| = 44 < 3 ∙ 𝑠 = 60,3 δεν είναι παρασιτικό σφάλμα.

    Λάθος. Βλέπε σελίδα 29, Τόμος Γ’. Τα θερμοζεύγη Α και Β έχουν την ίδια ορθότητα αλλά το Β έχει

    μεγαλύτερη πιστότητα από το Α.

    Οι ορθότητες των δύο θερμοζευγών αξιολογούνται με τις τιμές:

    |�̅�𝐴 − 1| = |12,5 − 12,4| = 0,1

    |�̅�𝛣 − 1| = |12,3 − 12,4| = 0,1

    Για την αποτίμηση και την ιεράρχηση της πιστότητας των δύο θερμοζευγών μπορούμε να

    χρησιμοποιήσουμε και να συγκρίνουμε είτε τις δειγματικές διασπορές είτε τις δειγματικές τυπικές

    αποκλίσεις. Οι δειγματικές τυπικές αποκλίσεις για τα θερμοζεύγη Α και Β είναι 𝑠𝐴 = 1,01 και 𝑠𝐵 =

    0,98 αντίστοιχα.

    Μεγαλύτερη (υψηλότερη) πιστότητα φαίνεται να έχει το θερμοζεύγος Β αφού έχει τη μικρότερη

    δειγματική τυπική απόκλιση.

    (ι-1.5) Αν η κλίμακα μέτρησης του μήκους της πλευράς ενός πλακιδίου έχει ακρίβεια ±0.025 m,

    τότε η τυπική αβεβαιότητα τύπου Β λόγω ακρίβειας της μέτρησης είναι 0.05

    3

    Σωστό. Βλέπε σελίδες 143-144, Τόμος Γ’. Αυτή αντιστοιχεί σε αβεβαιότητα τύπου Β από ομοιόμορφη

    κατανομή (επειδή δεν δίνεται η κατανομή των μετρήσεων). Η τυπική αβεβαιότητα τύπου Β λόγω

    ακρίβειας της μέτρησης είναι συνεπώς 𝑢2 =0,025

    √3=

    0,05

    2√3 𝑚

    Άσκηση 2 (14 μονάδες)

    Επιλέξτε τη σωστή απάντηση ανάμεσα στις (i), (ii), (iii) ή (iv) των παρακάτω παραγράφων (α)- (ζ). Αιτιολογήστε εν συντομία την απάντησή σας.

  • Θ.Ε. ΔΙΠ 50: Εργασία 4 (2019-20) Σελίδα 6 από 28

    (i) n − 5 βαθμούς ελευθερίας.

    (ii) n − 2 βαθμούς ελευθερίας.

    (iii) n − 4 βαθμούς ελευθερίας.

    (iv) n − 3 βαθμούς ελευθερίας.

    Σωστο το (i). Βλέπε θεώρημα 9.9 σελίδα 182. Το στατιστικό 𝑆𝑆𝐸

    𝜎2 έχει κατανομή 𝜒2 με 𝑛 − 𝑘 − 1

    βαθμούς ελευθερίας. Εδώ επειδή έχουμε 4 ανεξάρτητες μεταβλητές, θα έχουμε 𝑘 = 4. Άρα:

    𝑆𝑆𝐸

    𝜎2~𝜒𝑛−4−1

    2

    ή 𝑆𝑆𝐸

    𝜎2~𝜒𝑛−5

    2

    Σωστό το (iii).

    Το (i) είναι σωστό, βλέπε σελίδα 159, Τόμος Β’, σχέση (9.42)

    Για το (ii) ισχύει:

    𝐹 = (𝑆𝑆𝑇

    𝑆𝑆𝐸− 1) (𝑛 − 2) =

    𝑆𝑆𝑇 − 𝑆𝑆𝐸

    𝑆𝑆𝐸(𝑛 − 2) =

    𝑆𝑆𝑅

    𝑆𝑆𝐸∙ (𝑛 − 2) =

    𝑆𝑆𝑅

    𝑆𝑆𝐸𝑛 − 2

    επομένως είναι σωστή.

    Για το (iv) ισχύει:

    𝐹 =𝑟2𝑆𝑆𝑇

    𝑆𝑆𝐸/(𝑛 − 2)=

    𝑆𝑆𝑅𝑆𝑆𝑇 ∙ 𝑆𝑆𝑇

    𝑆𝑆𝐸/(𝑛 − 2)=

    𝑆𝑆𝑅

    𝑆𝑆𝐸/(𝑛 − 2)

    διότι 𝑟2 =𝑆𝑆𝑅

    𝑆𝑆𝑇.

    Επομένως είναι σωστή.

    Για το (iii) ισχύει:

    𝐹 =𝑆𝑆𝑅(𝑛 − 2)

    𝑠2=

    𝑆𝑆𝑅(𝑛 − 2)

    𝑆𝑆𝐸𝑛 − 2

    Το οποίο αν λάβουμε υπόψη και το (i), δεν είναι η σ.σ. F του ελέγχου σημαντικότητας της απλής

    γραμμικής παλινδρόμησης.

  • Θ.Ε. ΔΙΠ 50: Εργασία 4 (2019-20) Σελίδα 7 από 28

    Σωστό το (ii). Βλέπε σελίδα 186, Τόμος Β’. Συγκεκριμένα αρκεί να δούμε ότι ισχύει 𝑆𝑆𝑅𝑓 − 𝑆𝑆𝑅𝑟 =

    𝑆𝑆(𝛽𝑞|𝛽0, … , 𝛽𝑞−1) οπότε τότε θα ισχύει:

    𝐹 =(𝑆𝑆𝑅𝑓 − 𝑆𝑆𝑅𝑟)/(𝑞 − 2)

    𝑆𝑆𝐸/(𝑛 − 𝑞 − 1)=

    𝑆𝑆(𝛽𝑞|𝛽0, … , 𝛽𝑞−1)/(𝑞 − 2)

    𝑆𝑆𝐸/(𝑛 − 𝑞 − 1)=

    𝑆𝑆(𝛽𝑞|𝛽0, … , 𝛽𝑞−1)/(𝑞 − 2)

    𝑠2

    Βλέπε παράδειγμα 9.9, σελ. 66 Τευχιδίου Β.

    Το (i) δεν ισχύει διότι το 𝑆𝑆𝑇 είναι το ίδιο σε πλήρες γραμμικό πρότυπο και περιορισμένο.

    Για το (iii), ας θέσουμε για παράδειγμα 𝑞 = 4. Τότε το πλήρες γραμμικό πρότυπο είναι 𝑌𝑖 = 𝛽0 +

    𝛽1𝑥𝑖1 + 𝛽2𝑥𝑖2 + 𝛽3𝑥𝑖3 + 𝛽4𝑥𝑖4 + 𝜀𝑖. Το περιορισμένο πρότυπο θα είναι κατάλληλο εάν ισχύει η

    𝐻0: 𝛽3 = 𝛽4 = 0, ή διαφορετικά η 𝐻0: 𝛽𝑞−1 = 𝛽𝑞.

    Για το (iv), ισχύει το ακριβώς ανάποδο. Συγκεκριμένα,

    𝑅𝑓2 =

    𝑆𝑆𝑅𝑓

    𝑆𝑆𝑇≥

    𝑆𝑆𝑅𝑟𝑆𝑆𝑇

    = 𝑅𝑟2

    (βλέπε σχέση (9.90), σελίδα 186, Τόμος Β’)

    Επίσης, βλέπε σελίδα 181, η εισαγωγή περισσότερων όρων (προβλεπουσών μεταβλητών) σ’ ένα

    γραμμικό πρότυπο δεν μπορεί να μειώσει την τιμή του 𝑟2.

  • Θ.Ε. ΔΙΠ 50: Εργασία 4 (2019-20) Σελίδα 8 από 28

    Σωστό το (iii). Ισχύει ότι:

    𝑟𝑎𝑑𝑗2 = 1 −

    𝑆𝑆𝐸𝑛 − 𝑘 − 1

    𝑆𝑆𝑇𝑛 − 1

    = 1 −𝑆𝑆𝐸

    𝑆𝑆𝑇∙

    𝑛 − 1

    𝑛 − 𝑘 − 1= 1 −

    𝑆𝑆𝑇 − 𝑆𝑆𝑅

    𝑆𝑆𝑇∙

    𝑛 − 1

    𝑛 − 𝑘 − 1

    = 1 − (1 −𝑆𝑆𝑅

    𝑆𝑆𝑇) ∙

    𝑛 − 1

    𝑛 − 𝑘 − 1= 1 − (1 − 𝑟2) ∙

    𝑛 − 1

    𝑛 − 𝑘 − 1

    Συνεπώς από εδώ παρατηρούμε ότι όσο αυξάνεται το 𝑟2, αυξάνεται και το 𝑟𝑎𝑑𝑗2 (θα μπορούσατε να

    κάνετε και ένα αριθμητικό παράδειγμα, με διάφορες τιμές του 𝑟2, ώστε να δούμε την αύξηση). Αυτό

    ισχύει ωστόσο υπό την προϋπόθεση ότι έχουμε ένα μοντέλο πολλαπλής γραμμικής παλινδρόμησης,

    οπότε το k παραμένει σταθερό.

    (ε-2) Δυο μετρητικά όργανα (Α και Β) πρόκειται να συγκριθούν ως προς την ποιότητα των μετρήσεων βάρους. Για το σκοπό αυτό σε κάθε μετρητικό όργανο ζυγίζονται 20 όμοια βάρη ονομαστικού βάρους 10g. Τα αποτελέσματα της στατιστικής επεξεργασίας των μετρήσεων δίνονται στο ακόλουθο output του MINITAB.

    Statistics Variable Total Count Mean StDev Variance Minimum Maximum

    A 20 9.9470 0.0828 0.0069 9.7600 10.0300

    B 20 9.9925 0.0247 0.00061 9.9500 10.0300

    Με βάση αυτό, ποια από τις ακόλουθες προτάσεις ισχύει;

    (i) Το μετρητικό όργανο Α έχει μεγαλύτερη ορθότητα από το μετρητικό όργανο Β.

    (ii) Το μετρητικό όργανο Α έχει μεγαλύτερη πιστότητα από το μετρητικό όργανο Β.

    (iii) Το μετρητικό όργανο Α έχει μεγαλύτερη ακρίβεια από το μετρητικό όργανο Β.

    (iv) Το μετρητικό όργανο Β έχει μεγαλύτερη ακρίβεια από το μετρητικό όργανο Α. Σωστό το (iv). Το μετρητικό όργανο Β έχει μεγαλύτερη ορθότητα και πιστότητα, οπότε έχει και

    μεγαλύτερη ακρίβεια.

    Συγκεκριμένα:

    Για την ορθότητα:

    |�̅�𝐴 − 10| = |9,9470 − 10| = 0,053

    |�̅�𝛣 − 10| = |9,9925 − 10| = 0,0075

    οπότε το όργανο Β έχει μεγαλύτερη ορθότητα από το όργανο Α.

    Για την πιστότητα:

    𝑠𝐴 = 0,0828 > 0,0247 = 𝑠𝐵

    οπότε το όργανο Β έχει μεγαλύτερη πιστότητα από το όργανο Α.

    (στ-2) Για την τυπική αβεβαιότητα τύπου Α μιας σειράς n ανεξάρτητων μετρήσεων δεν ισχύει ότι:

    (i) οι μετρήσεις δεν είναι απαραίτητο να προέρχονται από κανονικό πληθυσμό.

    (ii) είναι ίση με την τυπική απόκλιση των n ανεξάρτητων μετρήσεων.

    (iii) 15 μετρήσεις είναι αρκετές για την εκτίμησή της.

  • Θ.Ε. ΔΙΠ 50: Εργασία 4 (2019-20) Σελίδα 9 από 28

    (iv) μειώνεται καθώς αυξάνεται το πλήθος n των ανεξάρτητων μετρήσεων.

    Σωστό το (ii). Η τυπική αβεβαιότητα τύπου Α ορίζεται ως:

    𝑢(𝑥𝑖) = 𝑠(�̅�) =𝑠(𝑞𝑘)

    √𝑛

    (βλέπε σελίδα 138, Τόμος Γ’). Δηλαδή είναι η τυπική απόκλιση της μέσης τιμής �̅� και όχι των 𝑛

    ανεξάρτητων μετρήσεων.

    Το (i) ισχύει διότι η αβεβαιότητα τύπου Α απορρέει από τυχαία επίδραση, οπότε μπορούμε να

    χρησιμοποιήσουμε την κανονική κατανομή ως βάση της ανάλυσης των μετρήσεων (βλέπε σελίδα

    138, Τόμος Γ’).

    Το (iii) ισχύει διότι, γενικά θέλουμε πάνω από 10 μετρήσεις

    Το (iv) ισχύει διότι, όσο αυξάνεται ο παρονομαστής της ποσότητας 𝑠(𝑞𝑘)

    √𝑛 τόσο μειώνεται η τυπική

    αβεβαιότητα τύπου Α.

    (ζ-2) Ποια από τις παρακάτω προτάσεις είναι σωστή;

    (i) Η αβεβαιότητα μιας μέτρησης οφείλεται στα τυχαία σφάλματα και στα άγνωστα συστηματικά σφάλματα.

    (ii) Η εκτεταμένη αβεβαιότητα είναι πάντοτε μεγαλύτερη από τη συνδυασμένη τυπική αβεβαιότητα για πεπερασμένους αποτελεσματικούς βαθμούς ελευθερίας.

    (iii) Η συνδυασμένη τυπική αβεβαιότητα της μέτρησης Y μπορεί να έχει αβεβαιότητα μόνο τύπου Α ή αβεβαιότητα μόνο τύπου Β.

    (iv) Όταν οι αβεβαιότητες τύπου Β δύο ποσοτήτων είναι ίσες, τότε και οι τυπικές τους αβεβαιότητες θα είναι ίσες.

    Σωστό το (ii). Αφού 𝑈=𝑘∙𝑈𝑐(𝑦), όπου 𝑘 > 1 για πεπερασμένους αποτελεσματικούς βαθμούς

    ελευθερίας (σελ. 141 και πίνακα 2.8 του Τόμου Γ΄ σελ. 150).

    Το (i) είναι λάθος διότι περιέχονται και υπολειπόμενα σφάλματα, (βλέπε, Τόμος Γ, σελ. 136 μπλε

    σχήμα)

    Η (iii) είναι λάθος γιατί μια συνδυασμένη αβεβαιότητα μπορεί να αποτελείται και από αβεβαιότητές

    τύπου Α και τύπου Β (Τόμος Γ΄ σελ. 139 πρώτη παράγραφός, επίσης παράδειγμα σελ. 143 – 144 του

    Τόμου Γ΄).

    Το (iv) δεν ισχύει διότι οι τυπικές αβεβαιότητες υπολογίζονται διαφορετικά, ανάλογα την κατανομή

    της κάθε αβεβαιότητας.

    Άσκηση 3 (11 μονάδες)

    Βιομηχανία παράγει πλαστικούς σωλήνες και μετρά το βάρος τους πριν τους προωθήσει στην αγορά με τη χρήση δυο ζυγών (Ζ1 και Ζ2). Ο υπεύθυνος ποιότητας της βιομηχανίας θέλει να αξιολογήσει την ποιότητα των μετρήσεων των δύο ζυγών. Για το λόγο αυτό ζυγίζει 10 σωλήνες ονομαστικού βάρους 1.0 Kg σε κάθε ζυγό. Τα αποτελέσματα που προκύπτουν (σε Kg) είναι τα ακόλουθα:

    α/α 1 2 3 4 5 6 7 8 9 10

    Ζ1 0.95 1.04 0.99 0.96 1.01 0.97 0.98 1.02 0.97 0.90

    Ζ2 1.02 0.99 0.98 0.98 0.98 0.99 1.01 0.98 0.97 0.99

  • Θ.Ε. ΔΙΠ 50: Εργασία 4 (2019-20) Σελίδα 10 από 28

    (α-2) Αξιολογήστε ποιος από τους δυο ζυγούς υπερέχει ως προς την ορθότητα.

    (β-2) Αξιολογήστε ποιος από τους δυο ζυγούς υπερέχει ως προς την πιστότητα.

    (γ-4) Αν υποθέσουμε ότι τα παραπάνω δεδομένα προέρχονται από κανονικά κατανεμημένους πληθυσμούς, ελέγξτε με τη χρήση κρίσιμης περιοχής, αν σε επίπεδο σημαντικότητας a = 0.02 μπορεί ο υπεύθυνος ποιότητας να ισχυριστεί ότι οι δύο ζυγοί διαφέρουν ως προς την πιστότητα των μετρήσεων τους. Απαντήστε στο ερώτημα αυτό χωρίς τη χρήση ΜΙΝΙΤΑΒ (το MINITAB μπορεί να χρησιμοποιηθεί μόνο για απλές πράξεις).

    (δ-3) Ποιον από τους δύο ζυγούς θα πρέπει να επιλέξει ο υπεύθυνος ποιότητας κρίνοντάς τους συνολικά ως προς την ακρίβεια των μετρήσεων τους;

    Βλέπε και Άσκηση αυτοαξιολόγησης 10.1, σελ. 109, Τευχίδιο Β’)

    (α) Θα βρούμε και θα συγκρίνουμε τις τιμές των απολύτων αποστάσεων των δειγματικών μέσων

    τιμών από την ονομαστική τιμή 1.

    Οι δειγματικές μέσες τιμές, θα βρεθούν από το Minitab:

    Stat – Basic Statistics – Display Descriptive statistics

    Variables: Z1, Z2

    Statistics: Mean, Standard Deviation, Variance (για το ερώτημα β)

    ΟΚ ΟΚ

    Descriptive Statistics: Z1; Z2

    Statistics

    Variable Mean StDev Variance

    Z1 0,9790 0,0396 0,0016

    Z2 0,98900 0,01524 0,00023

    Το Minitab βρίσκει �̅�𝐴 = 0,9790 και �̅�𝛣 = 0,98900. Επομένως, οι ορθότητες των δύο ζυγών

    αξιολογούνται με τις τιμές:

    |�̅�𝐴 − 1| = |0,9790 − 1| = 0,021

    |�̅�𝛣 − 1| = |0,989 − 1| = 0,011

    Επειδή 0,011

  • Θ.Ε. ΔΙΠ 50: Εργασία 4 (2019-20) Σελίδα 11 από 28

    𝐻𝛢 : 𝜎𝛣

    2

    𝜎𝛢2 ≠ 1

    στο 𝛼 = 0.02 επίπεδο σημαντικότητας, όπου 𝜎𝛢2, 𝜎𝛣

    2 είναι οι διασπορές των πληθυσμών (θεωρητικές

    διασπορές) των μετρήσεων του βάρους από τους δύο ζυγούς. Ο έλεγχος μπορεί να γίνει με τη

    διαδικασία της Υποενότητας 8.6.2 του Τόμου Β’.

    Η κ.π. είναι το σύνολο:

    𝐶 = {𝑓: 𝑓 < 𝐹1−

    0.022

    ,9,9} ∪ {𝑓: 𝑓 > 𝐹0.02

    2,9,9

    } = {𝑓: 𝑓 < 𝐹0.99,9,9} ∪ {𝑓: 𝑓 > 𝐹0.01,9,9}

    Από πίνακες της F κατανομής βρίσκουμε ότι 𝐹0.01,9,9 = 5,35

    Για το 𝐹0.99,9,9 χρησιμοποιούμε τη σχέση (6.34), σελίδα 23, Τόμος Β’:

    𝐹1−𝛼,𝜈1,𝜈2 =1

    𝐹𝛼,𝜈2,𝜈1

    Άρα:

    𝐹0.99,9,9 = 𝐹1−0.01,9,9 =1

    𝐹0.01,9,9=

    1

    5,35= 0,1869

    Άρα η κ.π. είναι:

    𝐶 = {𝑓: 𝑓 < 0,1869} ∪ {𝑓: 𝑓 > 5,35}

    όπου:

    𝑓 =𝑆𝐴

    2

    𝑆𝐵2 =

    0,0016

    0,00023= 6,9565

    Έχουμε ότι 6,9565>5,35. Άρα η παρατηρούμενη τιμή της σ.σ.ε. πέφτει εντός της κ.π. και, επομένως

    απορρίπτουμε την υπόθεση 𝐻0 των ίσων διασπορών. Δηλαδή, συμπεραίνουμε στο 0.02 επίπεδο

    σημαντικότητας ότι οι δύο ζυγοί διαφέρουν ως προς την πιστότητα.

    (δ) Ένα συνολικό μέτρο ακρίβειας είναι το μέσο τετραγωνικό σφάλμα (μτσ) που ορίστηκε για

    εκτιμήτριες στην Υποενότητα 7.1.1 του Τόμου Β’. Εδώ, μπορούμε να εκτιμήσουμε το μτσ κάθε

    οργάνου από το άθροισμα της δειγματικής διασποράς και του τετραγώνου της μεροληψίας. Δηλαδή,

    οι εκτιμητές των μτσ των Α και Β είναι:

    𝑠𝐴2 + (�̅�𝐴 − 1)

    2 = 0,0016 + (0,9790 − 1)2 = 0,002

    𝑠𝐵2 + (�̅�𝐵 − 1)

    2 = 0,00023 + (0,989 − 1)2 = 0,0004

    Η ακρίβεια του ζυγού Β είναι μεγαλύτερη αφού έχει μικρότερο μτσ.

    Άσκηση 4 (12 μονάδες)

    Κατά τη διακρίβωση μιας μετροταινίας ακρίβειας ±10 mm και διακριτικής ικανότητας ±8 mm η οποία ακολουθεί την τριγωνική κατανομή, εκτελούμε 9 μετρήσεις για κάθε ένα από 16 διαφορετικά πρότυπα μέτρα. Για κάθε μέτρο, η τυπική απόκλιση των αποκλίσεων από την ονομαστική του τιμή ισούται με 0.15, 0.07, 0.19, 0.30, 0.26, 0.21, 0.17, 0.12, 0.22, 0.28, 0.21, 0.29, 0.05, 0.09, 0.30 και 0.25 cm αντίστοιχα.

    (α-2) Να υπολογιστεί η τυπική αβεβαιότητα που οφείλεται στην επαναληψιμότητα της μετροταινίας και οι βαθμοί ελευθερίας της.

    (β-2) Να υπολογιστεί η αβεβαιότητα τύπου Β που οφείλεται στην ακρίβεια της μετροταινίας.

    (γ-2) Να υπολογιστεί η αβεβαιότητα τύπου Β λόγω της διακριτικής ικανότητας της μετροταινίας.

    (δ-2) Να υπολογιστεί η συνδυασμένη τυπική αβεβαιότητα της μετροταινίας.

  • Θ.Ε. ΔΙΠ 50: Εργασία 4 (2019-20) Σελίδα 12 από 28

    (ε-4) Να υπολογιστεί η εκτεταμένη τυπική αβεβαιότητα της μετροταινίας σε επίπεδο εμπιστοσύνης 95%.

    (α) Εδώ έχουμε 16 διαφορετικά πρότυπα και σε κάθε ένα από αυτά γίνονται 𝑛 = 9 μετρήσεις. Με

    βάση τις 9 μετρήσεις (που έγιναν) σε κάθε πρότυπο υπολογίστηκε για κάθε πρότυπο μέτρο η

    τυπική απόκλιση των μετρήσεων από την ονομαστική του τιμή, άρα έχουμε 16 τυπικές αποκλίσεις

    S1,S2,…,S16.

    Υπολογίζουμε την αβεβαιότητα τύπου Α (σελ. 138 τόμος Γ’):

    𝑢1 =𝑠

    √𝑛

    Όταν έχουμε μετρήσεις σε πολλά πρότυπα (εδώ σε 16) το 𝑠 αντικαθίσταται από την μεγαλύτερη

    τυπική απόκλιση (βλ. σελίδα 143, Τόμος Γ’). Η μέγιστη τυπική απόκλιση είναι 𝑠 = 0,30 𝑐𝑚.

    Άρα έχουμε:

    𝑢1 =𝑠

    √𝑛=

    0,30

    √9=

    0,30

    3= 0,10 𝑐𝑚

    με 9 − 1 = 8 βαθμούς ελευθερίας.

    (β) (Βλέπε σελ. 139-140, Τόμος Γ’)

    Προσοχή! Η ακρίβεια και η διακριτική ικανότητα δίνονται σε mm και οι τυπικές αποκλίσεις από την

    ονομαστική τιμή σε cm. Άρα η διακρίβωση μιας μετροταινίας έχει ακρίβεια ±1 c𝑚 και διακριτική

    ικανότητα ±0,8 c𝑚.

    Για την αβεβαιότητα τύπου B (αφού δε δίνεται καμία άλλη πληροφορία, θεωρείται ότι αντιστοιχεί

    σε ομοιόμορφη κατανομή (Τόμος Γ, σελ. 140, δεύτερη παράγραφος) για την ακρίβεια της

    μετροταινίας έχουμε (το μεσοδιάστημα είναι ±1) (βλέπε και σελίδα 147, άσκηση αυτοαξιολόγησης

    2.11, Τόμος Γ’):

    𝑢2 =1

    √3= 0,5774 𝑐𝑚

    με ∞ βαθμούς ελευθερίας.

    (γ) Για την αβεβαιότητα τύπου Β της διακριτικής ικανότητας με τριγωνική κατανομή έχουμε (το

    μεσοδιάστημα είναι 0,8) (βλέπε σελίδα 139, Τόμος Γ’):

    𝑢3 =0,8

    √6= 0,3266 𝑐𝑚

    με ∞ βαθμούς ελευθερίας.

    (δ) Η συνδυασμένη τυπική αβεβαιότητα θα είναι ίση με (σελ. 144, Τόμος Γ’):

    𝑢𝑐 = √𝑢12 + 𝑢2

    2 + 𝑢32 = √(0,10)2 + (0,5774)2 + (0,3266)2 = 0,6709 𝑐𝑚

  • Θ.Ε. ΔΙΠ 50: Εργασία 4 (2019-20) Σελίδα 13 από 28

    (ε) Για τον υπολογισμό της εκτεταμένης τυπικής αβεβαιότητας θα υπολογίσουμε αρχικά τους

    αποτελεσματικούς βαθμούς ελευθερίας:

    𝑣𝑒𝑓𝑓 =𝑢𝑐

    4

    𝑢14

    9 − 1 +𝑢2

    4

    ∞ +𝑢3

    4

    =(0,6709)4

    (0,10)4

    8

    = 16207,6912 ≈ ∞

    Η εκτεταμένη τυπική αβεβαιότητα θα είναι ίση με (σελ. 144, Τόμος Γ’):

    𝑈 = 𝑘 ∙ 𝑢𝑐 = 1,96 ∙ 0,6709 = 1,315 𝑐𝑚

    Το k το βρίσκουμε για 95% και ∞ βαθμούς ελευθερίας στον Πίνακα 2.8, στην σελίδα 150 Τόμος

  • Θ.Ε. ΔΙΠ 50: Εργασία 4 (2019-20) Σελίδα 14 από 28

    Άσκηση 5 (10 μονάδες)

    (βλέπε σελίδες 118-120, Τευχίδιο Β’)

    (α) Αντικαθιστώντας 𝛭𝛵 = 150 𝑁 ∙ 𝑐𝑚, 𝑟 = 10 𝑐𝑚, 𝑡 = 0,25 𝑐𝑚 έχουμε:

    𝜏 =𝛭𝛵

    2𝜋𝑟2𝑡=

    150

    2 ∙ 3,14 ∙ 102 ∙ 0,25∙

    𝑁 ∙ 𝑐𝑚

    𝑐𝑚2 ∙ 𝑐𝑚= 0,9554

    𝑁

    𝑐𝑚2

    (β) Οι μερικές παράγωγοι είναι:

    Ως προς τη ροπή στρέψης 𝛭𝛵: 𝜕𝜏

    𝜕𝛭𝑇=

    1

    2𝜋𝑟2𝑡=

    1

    157= 0.0064 𝑐𝑚−3

    Ως προς την ακτίνα 𝑟: 𝜕𝜏

    𝜕𝑟= −

    2 ∙ 𝑀𝑇2 ∙ 𝜋𝑟3𝑡

    = −𝑀𝑇

    𝜋𝑟3𝑡= −0.1911

    𝑁

    𝑐𝑚3

    Ως προς το πάχος 𝑡 του σωλήνα: 𝜕𝜏

    𝜕𝑡= −

    𝛭𝛵2𝜋𝑟2𝑡2

    = −3.8217 𝑁

    𝑐𝑚3

    (γ) Το σύνθετο πιθανό σφάλμα, το οποίο υπεισέρχεται στον υπολογισμό της διατμηματικής τάσης 𝜏

    είναι (βλ. σχέση (1.15), (Τόμος Γ, σελ. 51)):

    𝛿𝜏𝜏 = √(𝜕𝜏

    𝜕𝛭𝛵)

    2

    𝛿𝜏2(𝛭𝑇) + (𝜕𝜏

    𝜕𝑟)

    2

    𝛿𝜏2(𝑟) + (𝜕𝜏

    𝜕𝑡)

    2

    𝛿𝜏2(𝑡)

    = √(1

    2 ∙ 3.14 ∙ 102 ∙ 0.25)

    2

    ∙ (1.5)2 + (−150

    3.14 ∙ 103 ∙ 0.25)

    2

    ∙ (0.05)2 + (−150

    2 ∙ 3.14 ∙ 102 ∙ 0.252)

    2

    ∙ (0.001)2

    = √0.00019716 = 0,0140 𝑁

    𝑐𝑚2

    (δ) Το σχετικό σύνθετο πιθανό σφάλμα είναι: (βλέπε σελίδα 43, Τόμος Γ’) 𝛿𝜏𝜏

    𝜏=

    0,0140

    0,9554= 0,0147 (χωρίς μονάδες μέτρησης)

  • Θ.Ε. ΔΙΠ 50: Εργασία 4 (2019-20) Σελίδα 15 από 28

    (ή 1,47 %)

    Άσκηση 6 (13 μονάδες)

    Ένα άρθρο στο Optical Engineering παρουσιάζει μία νέα διάταξη οπτικής αλληλοσυσχέτισης για την πραγματοποίηση ενός πειράματος διαφοροποιώντας τη φωτεινότητα, την αντίθεση και τον κορεσμό. Ο διαμορφωτής φωτός που προκύπτει χαρακτηρίζεται από το χρήσιμο εύρος των διαβαθμίσεων του γκρι. Στον παρακάτω πίνακα δίνονται τα δεδομένα.

    Φωτεινότητα (%) 54 61 65 100 100 100 50 57 54

    Αντίθεση (%) 56 80 70 50 65 80 25 35 26

    Κορεσμός (%) 61 79 74 52 69 85 30 37 32

    Χρήσιμο εύρος (ng) 96 50 50 112 96 80 155 144 255

    (α-3.5) Με χρήση του ΜΙΝΙΤΑΒ να προσαρμοστεί ένα πρότυπο πολλαπλής γραμμικής παλινδρόμησης σε αυτά τα δεδομένα. Καταγράψτε την προσαρμοσμένη ευθεία παλινδρόμησης και ερμηνεύστε τους συντελεστές της με όρους του προβλήματος.

    (β-3) Είναι η παλινδρόμηση του ερωτήματος (α) στατιστικά σημαντική σε επίπεδο σημαντικότητα a = 0.05; Οι μεταβλητές Φωτεινότητα, Κορεσμός και Αντίθεση είναι στατιστικά σημαντικές στο παραπάνω πρότυπο;

    (γ-3.5) Ο υπεύθυνος του πειράματος αποφασίζει να αφαιρέσει τις μεταβλητές Φωτεινότητα και

    Κορεσμός από το πρότυπο γραμμικής παλινδρόμησης του ερωτήματος (α) και να προσαρμόσει το νέο πρότυπο με μόνη επεξηγηματική μεταβλητή την Αντίθεση. Να εξεταστεί, με χρήση κατάλληλου ελέγχου υποθέσεων σε επίπεδο σημαντικότητας a = 0.01, σε ποιο από τα παραπάνω πρότυπα θα πρέπει να καταλήξει ο υπεύθυνος του πειράματος.

    (δ-3) Στο επίπεδο σημαντικότητας a = 0.05 είναι σημαντική η μεταβλητή Φωτεινότητα στο πρότυπο που περιλαμβάνει μόνο τη μεταβλητή Αντίθεση;

    (α) Εξαρτημένη μεταβλητή είναι το Χρήσιμο εύρος (ng) (συμβ. Y)

    Ανεξάρτητες μεταβλητές είναι οι: Φωτεινότητα (%) (συμβ. X1), Αντίθεση (%) (συμβ. X2), Κορεσμός

    (%)(συμβ. X3)

    Ανοίγουμε το αρχείο του Minitab και στην συνέχεια έχουμε:

    Stat – Regression – Regression – Fit Regression Model

    Responses: Χρήσιμο εύρος (ng)

    Continuous Predictors: Φωτεινότητα (%), Αντίθεση (%), Κορεσμός (%)

    Επιλέγουμε Options... και δίπλα στο Sum of squares for tests επιλέγουμε Sequential (Type I). Στη

    συνέχεια πατάμε ΟΚ και ΟΚ:

    Regression Analysis: Χρήσιμο εύρος (ng) versus ... (%); Κορεσμός (%)

    Analysis of Variance

    Source DF Seq SS Seq MS F-Value P-Value

    Regression 3 25376,3 8458,8 5,98 0,041

    Φωτεινότητα (%) 1 3960,3 3960,3 2,80 0,155

    Αντίθεση (%) 1 20558,1 20558,1 14,54 0,012

  • Θ.Ε. ΔΙΠ 50: Εργασία 4 (2019-20) Σελίδα 16 από 28

    Κορεσμός (%) 1 858,0 858,0 0,61 0,471

    Error 5 7069,7 1413,9

    Total 8 32446,0

    Model Summary

    S R-sq R-sq(adj) R-sq(pred)

    37,6023 78,21% 65,14% 0,95%

    Coefficients

    Term Coef SE Coef T-Value P-Value VIF

    Constant 213,5 56,8 3,76 0,013

    Φωτεινότητα (%) 0,244 0,709 0,34 0,744 1,38

    Αντίθεση (%) -7,65 6,37 -1,20 0,284 107,23

    Κορεσμός (%) 5,17 6,64 0,78 0,471 108,90

    Regression Equation

    Χρήσιμο εύρος (ng) = 213,5 + 0,244 Φωτεινότητα (%) - 7,65 Αντίθεση (%) + 5,17 Κορεσμός (%)

    Η προσαρμοσμένη ευθεία παλινδρόμησης είναι:

    Y= 213,5 + 0,244*X1 - 7,65*X2 + 5,17*X3

    Οι συντελεστές ερμηνεύονται ως εξής:

    𝒃𝟏 = 𝟎, 𝟐𝟒𝟒 Μια μοναδιαία ποσοστιαία αύξηση της Μεταβλητής ‘Φωτεινότητα’ θα οδηγήσει σε

    0,244 ng αύξηση της εξαρτημένης μεταβλητής ‘Χρήσιμο εύρος (ng)’, με όλες τις άλλες μεταβλητές

    σταθερές.

    𝒃𝟐 = −𝟕, 𝟔𝟓 Μια μοναδιαία ποσοστιαία αύξηση της Μεταβλητής ‘Αντίθεση (%)’ θα οδηγήσει σε 7,65

    ng μείωση της εξαρτημένης μεταβλητής ‘Χρήσιμο εύρος (ng)’, με όλες τις άλλες μεταβλητές

    σταθερές.

    𝒃𝟑 = 𝟓, 𝟏𝟕 Μια μοναδιαία ποσοστιαία αύξηση της Μεταβλητής ‘Κορεσμός (%)’ θα οδηγήσει σε 5,17

    ng αύξηση της εξαρτημένης μεταβλητής ‘Χρήσιμο εύρος (ng)’, με όλες τις άλλες μεταβλητές

    σταθερές.

    (β) Από την τιμή P του F ελέγχου της παλινδρόμησης (𝐻0: 𝛽1 = 𝛽2 = 𝛽3 = 0 έναντι της ΗA:

    τουλάχιστον ένα βj≠0) παρατηρούμε ότι για επίπεδο σημαντικότητας α=0,05, έχουμε

    P=0,0410.05.

    (γ) To νέο πρότυπο που θέλουμε να ελέγξουμε είναι το

    𝛶 = 𝛽0 + 𝛽2𝑥2 + 𝜀

    Άρα ο έλεγχος που πρέπει να γίνει είναι:

    𝐻0: 𝛽1 = 𝛽3 = 0 έναντι της ΗΑ: δεν ισχύει η Η0

  • Θ.Ε. ΔΙΠ 50: Εργασία 4 (2019-20) Σελίδα 17 από 28

    Η στατιστική συνάρτηση του παραπάνω ελέγχου είναι (βλ. θεώρημα 9.12, σελίδα 187)

    𝐹 =(𝑆𝑆𝑅𝑓 − 𝑆𝑆𝑅𝑟)/(𝑘 − 𝑞)

    𝑆𝑆𝐸𝑓/(𝑛 − 𝑘 − 1)

    με κρίσιμη περιοχή 𝐹 ≥ 𝐹𝛼,𝑘−𝑞,𝑛−𝑘−1.

    Ακολουθώντας στο Minitab ακριβώς την ίδια διαδικασία με αυτή του ερωτήματος (α) αλλά

    επιλέγοντας ως επεξηγηματική μεταβλητή μόνο την Αντίθεση παίρνουμε τα παρακάτω

    αποτελέσματα:

    Regression Analysis: Χρήσιμο εύρος (ng) versus Αντίθεση (%)

    Analysis of Variance

    Source DF Seq SS Seq MS F-Value P-Value

    Regression 1 24196,3 24196,3 20,53 0,003

    Αντίθεση (%) 1 24196,3 24196,3 20,53 0,003

    Error 7 8249,7 1178,5

    Lack-of-Fit 6 7799,7 1300,0 2,89 0,422

    Pure Error 1 450,0 450,0

    Total 8 32446,0

    Model Summary

    S R-sq R-sq(adj) R-sq(pred)

    34,3298 74,57% 70,94% 48,10%

    Coefficients

    Term Coef SE Coef T-Value P-Value VIF

    Constant 253,1 32,5 7,79 0,000

    Αντίθεση (%) -2,545 0,562 -4,53 0,003 1,00

    Regression Equation

    Χρήσιμο εύρος (ng) = 253,1 - 2,545 Αντίθεση (%)

    Εδώ έχουμε 𝑘 = 3 (διότι έχουμε 3 ανεξάρτητες μεταβλητές στο πλήρες πρότυπο) 𝑞 = 1 (διότι

    έχουμε 1 ανεξάρτητη μεταβλητή στο πλήρες πρότυπο) 𝑆𝑆𝑅𝑓 = 25376,3 (με γαλάζιο χρώμα στον

    πίνακα ANOVA του προηγούμενου ερωτήματος), 𝑆𝑆𝑅𝑟 = 24196,3 (με πράσινο χρώμα στον πίνακα

    ANOVA), 𝑆𝑆𝐸𝑓 = 7069,7 (με κόκκινο χρώμα στον πίνακα ANOVA του προηγούμενου ερωτήματος). Η

    σ.σ.ε. (βλέπε τύπο (9.91), σελίδα 187, Τόμος Β’) έχει την κατανομή 𝐹𝑘−𝑞,𝑛−𝑘−1 = 𝐹2,9−3−1 = 𝐹2,5.

    Η παρατηρούμενη τιμή της σ.σ.ε. είναι:

    𝐹 =(𝑆𝑆𝑅𝑓 − 𝑆𝑆𝑅𝑟)/(𝑘 − 𝑞)

    𝑆𝑆𝐸𝑓/(𝑛 − 𝑘 − 1)=

    (25376,3 − 24196,3)/(3 − 1)

    7069,7/(9 − 3 − 1)= 0,4173

    Επειδή 𝐹 = 0,4173 < 𝐹0.01,2,5 = 13,3 (βρίσκουμε το σημείο 𝐹0.01,2,5 από πίνακες) δεν απορρίπτουμε

    τη μηδενική υπόθεση και συμπεραίνουμε ότι το περιορισμένο πρότυπο είναι προτιμότερο.

    (δ) (βλέπε και σελίδα 78, Παράδειγμα 9.12, ερώτημα (δ), Τευχίδιο Β’)

  • Θ.Ε. ΔΙΠ 50: Εργασία 4 (2019-20) Σελίδα 18 από 28

    Πλήρες πρότυπο: 𝑌 = 𝛽0 + 𝛽1𝑋1 + 𝛽2𝑋2 + 𝜀

    Περιορισμένο πρότυπο: 𝛶 = 𝛽0 + 𝛽2𝛸2

    Κάνουμε την υπόθεση:

    𝐻0: 𝛽1 = 0 έναντι 𝐻𝛢: 𝛽1 ≠ 0

    Τρέχουμε πρώτα το Πλήρες πρότυπο. Ανοίγουμε το αρχείο του Minitab και στην συνέχεια έχουμε:

    Stat – Regression – Regression – Fit Regression Model

    Responses: Χρήσιμο εύρος (ng)

    Continuous Predictors: Φωτεινότητα (%), Αντίθεση (%)

    Επιλέγουμε Options... και δίπλα στο Sum of squares for tests επιλέγουμε Sequential (Type I). Στη

    συνέχεια πατάμε ΟΚ και ΟΚ:

    Regression Analysis: Χρήσιμο εύρος (ng) versus ... α (%); Αντίθεση (%)

    Analysis of Variance

    Source DF Seq SS Seq MS F-Value P-Value

    Regression 2 24518 12259 9,28 0,015

    Φωτεινότητα (%) 1 3960 3960 3,00 0,134

    Αντίθεση (%) 1 20558 20558 15,56 0,008

    Error 6 7928 1321

    Total 8 32446

    Model Summary

    S R-sq R-sq(adj) R-sq(pred)

    36,3493 75,57% 67,42% 44,04%

    Coefficients

    Term Coef SE Coef T-Value P-Value VIF

    Constant 238,6 45,2 5,27 0,002

    Φωτεινότητα (%) 0,334 0,676 0,49 0,639 1,34

    Αντίθεση (%) -2,717 0,689 -3,94 0,008 1,34

    Θέτουμε 𝑘 = 2, 𝑞 = 1, 𝑆𝑆𝑅𝑓 = 24518 (με ροζ, στον πιο πάνω πίνακα) και 𝑆𝑆𝑅𝑟 = 24196.3, (από τα

    αποτελέσματα της απλής γραμμικής παλινδρόμησης του ερωτήματος γ) και 𝑆𝑆𝐸𝑓 = 7928 (με γκρι

    στον πιο πάνω πίνακα).

    Η στατιστική συνάρτηση ελέγχου είναι:

    𝐹 =(𝑆𝑆𝑅𝑓 − 𝑆𝑆𝑅𝑟)/(𝑘 − 𝑞)

    𝑆𝑆𝐸𝑓/(𝑛 − 𝑘 − 1)=

    (24518 − 24196.3)/(2 − 1)

    7928/(9 − 2 − 1)= 0,2435

    Επειδή 𝐹 < 𝐹0.05,1,6 = 5,99 (βρίσκουμε το σημείο 𝐹0.05,1,6 από πίνακα Π4, σελίδα 212 Τόμος Β’) δεν

    απορρίπτουμε τη μηδενική υπόθεση. Άρα η μεταβλητή ‘Φωτεινότητα’ δεν είναι σημαντική στο

    πρότυπο που περιλαμβάνει μόνο τη μεταβλητή ‘Αντίθεση’

  • Θ.Ε. ΔΙΠ 50: Εργασία 4 (2019-20) Σελίδα 19 από 28

    Άσκηση 7 (14 μονάδες)

    Η δύναμη τάσης ενός συνθετικού νήματος (Y) θεωρείται ότι σχετίζεται με το ποσοστό βαμβακιού που περιέχεται στο νήμα. Για να διερευνηθεί η υπόθεση αυτή συλλέχθηκαν 10 τεμάχια νήματος τα οποία παράχθηκαν κάτω από διαφορετικές συνθήκες. Τα αποτελέσματα που αφορούν την τάση του νήματος και το ποσοστό του βαμβακιού που περιέχεται σε αυτά δίνονται στον ακόλουθο πίνακα:

    α/α 1 2 3 4 5 6 7 8 9 10

    Δύναμη τάσης νήματος (Ν) 212 231 231 224 217 242 233 234 228 228

    Ποσοστό βαμβακιού στο νήμα (%) 22 25 29 22 28 32 29 28 27 30

    (α-3) Να βρεθεί η προσαρμοσμένη ευθεία παλινδρόμησης για τα δεδομένα του πίνακα. Απαντήστε στο ερώτημα αυτό χωρίς τη χρήση ΜΙΝΙΤΑΒ.

    (β-3.5) Με χρήση κατάλληλου διαστήματος εμπιστοσύνης ελέγξτε αν η παλινδρόμηση είναι στατιστικά σημαντική σε επίπεδο σημαντικότητας a = 0.05. Απαντήστε στο ερώτημα αυτό χωρίς τη χρήση ΜΙΝΙΤΑΒ.

    (γ-2.5) Ο υπεύθυνος ποιότητας μιας κλωστοϋφαντουργίας που θέλει να αγοράσει νήμα αυτού του τύπου, θεωρεί ότι η δύναμη τάσης του νήματος (Y) επηρεάζεται όχι μόνο από το ποσοστό του βαμβακιού (x1)) αλλά και από τη διάρκεια της αποξήρανσης (σε ώρες) του νήματος (x2). Για το λόγο αυτό, για τα νήματα του προηγούμενου πίνακα ζήτησε τη διάρκεια αποξήρανσης τους. Τα νέα δεδομένα δίνονται στον ακόλουθο πίνακα:

    α/α 1 2 3 4 5 6 7 8 9 10

    Διάρκεια αποξήρανσης νήματος (h) 2.1 2.2 2.3 2.5 3.1 2.9 2.8 2.2 2.6 3.2

    Με χρήση του ΜΙΝΙΤΑΒ να προσαρμοστεί στα δεδομένα ένα πρότυπο πολλαπλής γραμμικής παλινδρόμησης με εξαρτημένη μεταβλητή τη δύναμη τάσης του νήματος (Y) και ανεξάρτητες μεταβλητές το ποσοστό βαμβακιού στο νήμα (x1) και τη διάρκεια αποξήρανσης του νήματος (x2). Είναι στατιστικά σημαντική η παλινδρόμηση σε επίπεδο σημαντικότητας a = 0.05;

    (δ-3) Σε επίπεδο σημαντικότητας a = 0.05, υπάρχουν σημαντικές ενδείξεις ότι πρέπει να προστεθεί ο όρος x2 στο πρότυπο παλινδρόμησης που βρήκατε στο ερώτημα (α);

    (ε-2) Μετά την προσαρμογή του καταλληλότερο προτύπου σύμφωνα με την απάντηση σας στο ερώτημα (δ), με χρήση του MINITAB να κάνετε το διάγραμμα υπολοίπων ως προς τις προσαρμοσμένες τιμές. Τι παρατηρείτε;

    (α) Η προσαρμοσμένη ευθεία παλινδρόμησης είναι γενικά η:

    �̂� = 𝑏0 + 𝑏1𝑥

    με

    𝑏1 =𝑛 ∑ 𝑥𝑖𝑦𝑖

    𝑛𝑖=1 − (∑ 𝑥𝑖

    𝑛𝑖=1 )(∑ 𝑦𝑖

    𝑛𝑖=1 )

    𝑛(∑ 𝑥𝑖2𝑛

    𝑖=1 ) − (∑ 𝑥𝑖𝑛𝑖=1 )

    2

    και 𝑏0 = �̅� − 𝑏1�̅�.

    Με τη βοήθεια του Excel παίρνουμε:

    ∑ 𝑥𝑖

    10

    𝑖=1

    = 272

    ∑ 𝑦𝑖

    10

    𝑖=1

    = 2280

    ∑ 𝑥𝑖2

    10

    𝑖=1

    = 7496

  • Θ.Ε. ΔΙΠ 50: Εργασία 4 (2019-20) Σελίδα 20 από 28

    ∑ 𝑥𝑖𝑦𝑖

    10

    𝜄=1

    = 62191

    �̅� = 228

    �̅� = 27,2

    ∑ 𝑦𝑖2

    10

    𝑖=1

    = 520508

    Άρα

    𝑏1 =10 ∙ 62191 − 272 ∙ 2280

    10 ∙ 7496 − (272)2= 1,7930

    𝑏0 = �̅� − 𝑏1�̅� = 228 − 1.7930 ∙ 27.2 = 179.2304

    Συνεπώς η ευθεία παλινδρόμησης είναι:

    �̂� = 179.2304 + 1.7930 ∙ 𝑋

    (β) Θα ελέγξουμε την υπόθεση 𝐻0: 𝛽1 = 0 έναντι 𝐻𝐴: 𝛽1 ≠ 0 με χρήση διαστήματος εμπιστοσύνης.

    Από τη σελίδα 157, Τόμος Β’ προκύπτει ότι το 100(1 − 𝛼)% δ.ε. για την παράμετρο 𝛽1 είναι:

    𝑏1 ± 𝑡𝑎2

    ,𝑛−2𝑠(𝐵1)

    όπου

    𝑠(𝐵1) =𝑠

    [∑ (𝑥𝑖 − �̅�)2𝑛𝑖=1 ]

    12

    με

    𝑠2 =∑ (𝑦𝑖 − 𝑦�̂�)

    2𝑛𝑖=1

    𝑛 − 2

    Αντικαθιστώντας τα δεδομένα και με τη βοήθεια του Excel παίρνουμε:

    𝑠2 =∑ (𝑦𝑖 − 𝑦�̂�)

    210𝑖=1

    10 − 2=

    354,21926

    8= 44,2774

    με 𝑠 = √44,2774 = 6,6541

    Επίσης πάλι από το Excel έχουμε ότι:

    [∑(𝑥𝑖 − �̅�)2

    𝑛

    𝑖=1

    ]

    12

    = (97,6)1/2 = √97,6 = 9,8793

    Άρα:

    𝑠(𝐵1) =𝑠

    [∑ (𝑥𝑖 − �̅�)2𝑛𝑖=1 ]

    12

    =6,6541

    9,8793= 0,6735

    Το 95 % δ.ε. είναι:

    𝑏1 ± 𝑡𝑎2

    ,𝑛−2𝑠(𝐵1) = 1.7930 ± 𝑡0.05

    2,10−2

    ∙ 0,6735 = 1.7930 ± 𝑡0.025,8 ∙ 0,6735

    Από πίνακες της t κατανομής βρίσκουμε ότι 𝑡0.025,8 = 2,306

    Άρα:

    1.7930 ± 2,306 ∙ 0,6735 = 1.79 ± 1.553091

    ή

    (0.236909, 3.343091)

    Εφόσον το 0 δεν ανήκει στο παραπάνω δ.ε., προκύπτει ότι η 𝐻0 απορρίπτεται σε επίπεδο

    σημαντικότητας 5 %, οπότε η παλινδρόμηση είναι στατιστικά σημαντική.

  • Θ.Ε. ΔΙΠ 50: Εργασία 4 (2019-20) Σελίδα 21 από 28

    (γ) Εισάγουμε τα δεδομένα στις στήλες C1 – C4 στο ΜΙΝΙΤΑΒ (στη στήλη C1 το y και στις C2, C3 τα

    x1, x2 αντίστοιχα). Εφαρμόζουμε τη διαδικασία Stat -Regression – Regression - Fit Regression

    Model, επιλέγοντας τη μεταβλητή y στο πεδίο Responses και τα x1, x2 στο πεδίο Continuous

    Predictors. Επιλέγουμε Options... και δίπλα στο Sum of squares for tests επιλέγουμε Sequential (Type

    I). Στη συνέχεια πατάμε ΟΚ και ΟΚ:

    Regression Analysis: Y versus X1; X2

    Analysis of Variance

    Source DF Seq SS Seq MS F-Value P-Value

    Regression 2 403,12 201,56 5,33 0,039

    X1 1 313,78 313,78 8,29 0,024

    X2 1 89,34 89,34 2,36 0,168

    Error 7 264,88 37,84

    Total 9 668,00

    Model Summary

    S R-sq R-sq(adj) R-sq(pred)

    6,15145 60,35% 49,02% 0,00%

    Coefficients

    Term Coef SE Coef T-Value P-Value VIF

    Constant 185,5 17,5 10,58 0,000

    X1 2,508 0,777 3,23 0,015 1,56

    X2 -9,94 6,47 -1,54 0,168 1,56

    Regression Equation

    Y = 185,5 + 2,508 X1 - 9,94 X2

    Ελέγχουμε την υπόθεση

    𝐻0: 𝛽1 = 𝛽2 = 0

    έναντι της υπόθεσης

    𝐻𝐴: 𝜏𝜊𝜐𝜆ά𝜒𝜄𝜎𝜏𝜊𝜈 έ𝜈𝛼 𝛽𝑗 ≠ 0.

    Η τιμή-Ρ του ελέγχου για τη σημαντικότητα της παλινδρόμησης ισούται με 0.039, άρα η

    παλινδρόμηση είναι στατιστικά σημαντική σε επίπεδο σημαντικότητας α = 0.05.

    (δ) Τρέχουμε στο Minitab και το μοντέλο της απλής γραμμικής παλινδρόμησης, με ακριβώς την ίδια

    διαδικασία όπως στο ερώτημα (γ), μόνο που τώρα θέτουμε μόνο τη x1 στο πεδίο Continuous

    Predictors.

    Regression Analysis: Y versus X1

  • Θ.Ε. ΔΙΠ 50: Εργασία 4 (2019-20) Σελίδα 22 από 28

    Analysis of Variance

    Source DF Seq SS Seq MS F-Value P-Value

    Regression 1 313,8 313,78 7,09 0,029

    X1 1 313,8 313,78 7,09 0,029

    Error 8 354,2 44,28

    Lack-of-Fit 5 135,7 27,14 0,37 0,842

    Pure Error 3 218,5 72,83

    Total 9 668,0

    Model Summary

    S R-sq R-sq(adj) R-sq(pred)

    6,65413 46,97% 40,34% 12,83%

    Coefficients

    Term Coef SE Coef T-Value P-Value VIF

    Constant 179,2 18,4 9,72 0,000

    X1 1,793 0,674 2,66 0,029 1,00

    Regression Equation

    Y = 179,2 + 1,793 X1

    Εδώ θέλουμε να ελέγξουμε την 𝐻0: 𝛽2 = 0 έναντι της 𝐻𝐴: 𝛽2 ≠ 0 σε ένα πρότυπο γραμμικής

    παλινδρόμησης με 𝑛 = 10 και 𝑘 = 2 (διότι έχουμε 2 ανεξάρτητες στο πλήρες πρότυπο).

    Έχουμε 𝑞 = 1, 𝑆𝑆𝑅𝑓 = 403,12 (με γαλάζιο χρώμα στον πίνακα ANOVA του προηγούμενου

    ερωτήματος), 𝑆𝑆𝑅𝑟 = 313,8 (με πράσινο χρώμα στον πίνακα ANOVA), 𝑆𝑆𝐸𝑓 = 264,88 (με κόκκινο

    χρώμα στον πίνακα ANOVA του προηγούμενου ερωτήματος). Η σ.σ.ε. (βλέπε τύπο (9.91), σελίδα

    187, Τόμος Β’) έχει την κατανομή 𝐹𝑘−𝑞,𝑛−𝑘−1 = 𝐹1,10−2−1 = 𝐹1,7. Η παρατηρούμενη τιμή της σ.σ.ε.

    είναι:

    𝐹 =(𝑆𝑆𝑅𝑓 − 𝑆𝑆𝑅𝑟)/(𝑘 − 𝑞)

    𝑆𝑆𝐸𝑓/(𝑛 − 𝑘 − 1)=

    (403,12 − 313,8)/(2 − 1)

    264,88/(10 − 2 − 1)= 2,3605

    Επειδή 𝐹 < 𝐹0.05,1,7 = 5,59 (βρίσκουμε το σημείο 𝐹0.05,1,7 από πίνακες) δεν απορρίπτουμε τη

    μηδενική υπόθεση και συμπεραίνουμε ότι το περιορισμένο πρότυπο είναι προτιμότερο.

    (ε) Θα χρησιμοποιήσουμε το πρότυπο με ανεξάρτητη μεταβλητή μόνο την 𝑥1 καθώς είναι το

    καταλληλότερο.

    Στο Minitab:

    Stat -Regression – Regression - Fit Regression Model

    Responses: y

  • Θ.Ε. ΔΙΠ 50: Εργασία 4 (2019-20) Σελίδα 23 από 28

    Continuous Predictors: x1

    Graphs:

    OK OK

    Παρατηρούμε ότι υπάρχει ακανόνιστη διάταξη των υπολοίπων γύρω από τη γραμμή 𝑒 = 0.

    Επομένως, τα υπόλοιπα δείχνουν ότι το απλό γραμμικό πρότυπο είναι ικανοποιητικό στην εξήγηση

    της μεταβλητότητας των δεδομένων 𝑦𝑖 (𝑖 = 1,2, … ,10). (Βλέπε και σελίδα 90, Τευχιδίου Β’).

    Άσκηση 8 (11 μονάδες)

    Σε μια δεξαμενή, για να αποτιμηθεί η αποτελεσματικότητα των μέτρων ελέγχου της ατμοσφαιρικής ρύπανσης που προκαλείται από την απώλεια υδρογονανθράκων κατά τη διοχέτευση βενζίνης σε αυτή, έγιναν 32 μετρήσεις της ποσότητας των υδρογονανθράκων που διαφεύγει στην ατμόσφαιρα. Η ποσότητα Y των υδρογονανθράκων που διαφεύγει στην ατμόσφαιρα (g) πιστεύεται ότι εξαρτάται από τη θερμοκρασία της δεξαμενής x1) (oF), από τη θερμοκρασία της βενζίνης που διοχετεύεται στη δεξαμενή x2 (oF), από την αρχική πίεση στη δεξαμενή x3 (lb/in2), καθώς και από την πίεση της βενζίνης που διοχετεύεται x4 (lb/in2). Τα δεδομένα που συλλέχθηκαν δίνονται στο αρχείο Askisi8.mpx

    (α-3) Με χρήση του MINITAB κατασκευάστε τον πίνακα συσχετίσεων των μεταβλητών x1, x2, x3 και x4. Ποια είναι τα συμπεράσματά σας για τη σχέση των μεταβλητών αυτών;

    (β-3.5) Με χρήση του ΜΙΝΙΤΑΒ προσαρμόστε στα δεδομένα ένα πρότυπο πολλαπλής γραμμικής παλινδρόμησης με εξαρτημένη μεταβλητή την ποσότητα των υδρογονανθράκων που διαφεύγει στην ατμόσφαιρα και ανεξάρτητες μεταβλητές όλες τις υπόλοιπες. Να γραφεί η ακριβής μορφή του προτύπου. Ερμηνεύστε την τιμή του συντελεστή προσδιορισμού που εμφανίζεται στα αποτελέσματα του ΜΙΝIΤΑΒ, και ελέγξτε τη σημαντικότητα της παλινδρόμησης σε επίπεδο σημαντικότητας a = 0.05.

  • Θ.Ε. ΔΙΠ 50: Εργασία 4 (2019-20) Σελίδα 24 από 28

    (γ-2.5) Εφαρμόστε με χρήση του MINITAB τη μέθοδο της βήμα προς βήμα παλινδρόμησης,

    με α1=α2=0.15, για να επιλέξετε το πρότυπο που περιγράφει τη σχέση της ποσότητας

    υδρογονανθράκων που διαφεύγει στην ατμόσφαιρα με κάποια, κάποιες ή όλες τις επεξηγηματικές μεταβλητές. Να γραφεί η ακριβής μορφή του προτύπου στo οποίo καταλήγει η μέθοδος σε κάθε βήμα της.

    (δ-2) Εφαρμόστε με χρήση του MINITAB τη μέθοδο της πίσω απαλοιφής, με α2=0.15, για να επιλέξετε το πρότυπο που περιγράφει τη σχέση της ποσότητας υδρογονανθράκων που διαφεύγει στην ατμόσφαιρα με κάποια, κάποιες ή όλες τις επεξηγηματικές μεταβλητές. Να γραφεί η ακριβής μορφή του προτύπου στo οποίo καταλήγει η μέθοδος σε κάθε βήμα της.

    (α) Στο Minitab:

    Stat-Basic Statistics-Correlation

    Variables: x1 x2 x3 x4

    Method: Pearson Correlation

    Display p-values

    OK

    Correlation: x1; x2; x3; x4 Correlations

    x1 x2 x3

    x2 0,774

    0,000

    x3 0,955 0,782

    0,000 0,000

    x4 0,934 0,837 0,985

    0,000 0,000 0,000

    Cell Contents

    Pearson correlation

    P-Value

    Συμπεραίνουμε ότι υπάρχουν στατιστικά σημαντικές ισχυρές γραμμικές συσχετίσεις (απορρίπτεται

    η 𝐻0: 𝜌 = 0, καθώς p-τιμές

  • Θ.Ε. ΔΙΠ 50: Εργασία 4 (2019-20) Σελίδα 25 από 28

    x2 1 494,43 494,43 66,34 0,000

    x3 1 90,63 90,63 12,16 0,002

    x4 1 78,09 78,09 10,48 0,003

    Error 27 201,23 7,45

    Total 31 2721,50

    Model Summary

    S R-sq R-sq(adj) R-sq(pred)

    2,73000 92,61% 91,51% 88,59%

    Coefficients

    Term Coef SE Coef T-Value P-Value VIF

    Constant 1,02 1,86 0,55 0,590

    x1 -0,0286 0,0906 -0,32 0,755 13,00

    x2 0,2158 0,0677 3,19 0,004 4,72

    x3 -4,32 2,85 -1,52 0,141 71,30

    x4 8,97 2,77 3,24 0,003 61,93

    Regression Equation

    y = 1,02 - 0,0286 x1 + 0,2158 x2 - 4,32 x3 + 8,97 x4

    Fits and Diagnostics for Unusual Observations

    Obs y Fit Resid Std Resid

    15 24,00 19,71 4,29 2,06 R

    18 46,00 44,39 1,61 0,83 X

    23 31,00 36,59 -5,59 -2,33 R

    R Large residual

    X Unusual X

    Η ακριβής τιμή του προτύπου είναι η:

    �̂�= 1,02 - 0,0286*x1 + 0,2158*x2 - 4,32*x3 + 8,97*x4

    Ο συντελεστής προσδιορισμού είναι R-sq=92.61% γεγονός που σημαίνει ότι το 92.61% της

    μεταβλητότητας της y ερμηνεύεται από τις ερμηνευτικές μεταβλητές του παραπάνω προτύπου.

    Η τιμή-P του ελέγχου σημαντικότητας της παλινδρόμησης (𝐻0: 𝛽1 = 𝛽2 = 𝛽3 = 𝛽4 = 0 έναντι της

    𝛨𝐴: τουλάχιστον ένα 𝛽𝑗 ≠ 0) είναι μικρότερη από 0.05 = 𝛼, άρα απορρίπτεται η μηδενική υπόθεση

    και άρα η παλινδρόμηση είναι στατιστικά σημαντική.

    (γ) Εφαρμόζουμε και πάλι τη διαδικασία Stat-Regression-Regression-Fit Regression Model,

    επιλέγοντας τη μεταβλητή y στο πεδίο Responses και τις x1, x2, x3, x4 στο πεδίο Continuous

    Predictors. Επιλέγουμε Options... και δίπλα στο Sum of squares for tests επιλέγουμε Sequential (Type

  • Θ.Ε. ΔΙΠ 50: Εργασία 4 (2019-20) Σελίδα 26 από 28

    I) και πατάμε ΟΚ. Στη συνέχεια πατάμε Stepwise…, επιλέγουμε Stepwise δίπλα από το Method:,

    θέτουμε 0.15 στα Alpha to enter: και Alpha to remove: και επιλέγουμε Include details for each step

    στο κάτω μέρος του παραθύρου. Στη συνέχεια πατάμε ΟΚ και ΟΚ:

    Regression Analysis: y versus x1; x2; x3; x4

    Stepwise Selection of Terms Candidate terms: x1; x2; x3; x4

    ----Step 1---- -----Step 2---- -----Step 3----

    Coef P Coef P Coef P

    Constant 4,31 0,19 1,07

    x4 6,203 0,000 3,602 0,000 9,25 0,001

    x2 0,2747 0,000 0,2091 0,003

    x3 -4,89 0,033

    S 3,70289 2,86709 2,68575

    R-sq 84,89% 91,24% 92,58%

    R-sq(adj) 84,38% 90,64% 91,78%

    R-sq(pred) 82,54% 88,90% 89,15%

    Mallows’ Cp 27,19 5,99 3,10

    α to enter = 0,15; α to remove = 0,15

    Analysis of Variance

    Source DF Seq SS Seq MS F-Value P-Value

    Regression 3 2519,53 839,84 116,43 0,000

    x2 1 2250,46 2250,46 311,99 0,000

    x3 1 177,22 177,22 24,57 0,000

    x4 1 91,85 91,85 12,73 0,001

    Error 28 201,97 7,21

    Total 31 2721,50

    Model Summary

    S R-sq R-sq(adj) R-sq(pred)

    2,68575 92,58% 91,78% 89,15%

    Coefficients

    Term Coef SE Coef T-Value P-Value VIF

    Constant 1,07 1,82 0,58 0,564

    x2 0,2091 0,0633 3,31 0,003 4,26

    x3 -4,89 2,18 -2,25 0,033 42,90

    x4 9,25 2,59 3,57 0,001 55,91

  • Θ.Ε. ΔΙΠ 50: Εργασία 4 (2019-20) Σελίδα 27 από 28

    Regression Equation

    y = 1,07 + 0,2091 x2 - 4,89 x3 + 9,25 x4

    Fits and Diagnostics for Unusual Observations

    Obs y Fit Resid Std Resid

    15 24,00 19,73 4,27 2,08 R X

    18 46,00 44,42 1,58 0,83 X

    23 31,00 36,62 -5,62 -2,38 R

    R Large residual

    X Unusual X

    Πρότυπο μετά το 1ο βήμα: �̂� = 4,31 + 6,203 ∙ 𝑥4

    Πρότυπο μετά το 2ο βήμα: �̂� = 0,19 + 0,2747 ∙ 𝑥2 + 3,602 ∙ 𝑥4

    Το πρότυπο στο οποίο καταλήγει η μέθοδος είναι το

    �̂� = 1,07 + 0,2091 ∙ 𝑥2 − 4,89 ∙ 𝑥3 + 9,25 ∙ 𝑥4

    (δ) Εφαρμόζουμε και πάλι τη διαδικασία Stat-Regression-Regression-Fit Regression Model,

    επιλέγοντας τη μεταβλητή y στο πεδίο Responses και τις x1, x2, x3, x4 στο πεδίο Continuous

    Predictors. Επιλέγουμε Options... και δίπλα στο Sum of squares for tests επιλέγουμε Sequential (Type

    I) και πατάμε ΟΚ. Στη συνέχεια πατάμε Stepwise…, επιλέγουμε Backward Elimination δίπλα από το

    Method:, θέτουμε 0.15 στο Alpha to remove: και επιλέγουμε Include details for each step στο κάτω

    μέρος του παραθύρου. Στη συνέχεια πατάμε ΟΚ και ΟΚ:

    Regression Analysis: y versus x1; x2; x3; x4

    Backward Elimination of Terms Candidate terms: x1; x2; x3; x4

    -----Step 1----- -----Step 2----

    Coef P Coef P

    Constant 1,02 1,07

    x1 -0,0286 0,755

    x2 0,2158 0,004 0,2091 0,003

    x3 -4,32 0,141 -4,89 0,033

    x4 8,97 0,003 9,25 0,001

    S 2,73000 2,68575

    R-sq 92,61% 92,58%

    R-sq(adj) 91,51% 91,78%

    R-sq(pred) 88,59% 89,15%

    Mallows’ Cp 5,00 3,10

    α to remove = 0,15

  • Θ.Ε. ΔΙΠ 50: Εργασία 4 (2019-20) Σελίδα 28 από 28

    Analysis of Variance

    Source DF Seq SS Seq MS F-Value P-Value

    Regression 3 2519,53 839,84 116,43 0,000

    x2 1 2250,46 2250,46 311,99 0,000

    x3 1 177,22 177,22 24,57 0,000

    x4 1 91,85 91,85 12,73 0,001

    Error 28 201,97 7,21

    Total 31 2721,50

    Model Summary

    S R-sq R-sq(adj) R-sq(pred)

    2,68575 92,58% 91,78% 89,15%

    Coefficients

    Term Coef SE Coef T-Value P-Value VIF

    Constant 1,07 1,82 0,58 0,564

    x2 0,2091 0,0633 3,31 0,003 4,26

    x3 -4,89 2,18 -2,25 0,033 42,90

    x4 9,25 2,59 3,57 0,001 55,91

    Regression Equation

    y = 1,07 + 0,2091 x2 - 4,89 x3 + 9,25 x4

    Fits and Diagnostics for Unusual Observations

    Obs y Fit Resid Std Resid

    15 24,00 19,73 4,27 2,08 R X

    18 46,00 44,42 1,58 0,83 X

    23 31,00 36,62 -5,62 -2,38 R

    R Large residual

    X Unusual X

    Πρότυπο μετά το 1ο βήμα:

    �̂� = 1,02 − 0,0286 ∙ 𝑥1 + 0,2158 ∙ 𝑥2 − 4,32 ∙ 𝑥3 + 8,97 ∙ 𝑥4 Το πρότυπο στο οποίο καταλήγει η μέθοδος είναι το

    �̂� = 1,07 + 0,2091*x2 - 4,89*x3 + 9,25*x4