ตัวแปรสุ่ม ตัวแปรสุ่มแบบไม่ต่อเนื่อง ความคาดหวังทางคณิตศาสตร์

คำจำกัดความของตัวแปรสุ่มเหตุการณ์สุ่มจำนวนมากสามารถหาปริมาณได้ด้วยตัวแปรสุ่ม

สุ่มคือปริมาณที่ใช้ค่าขึ้นอยู่กับการรวมกันของสถานการณ์สุ่ม

ตัวแปรสุ่ม ได้แก่ จำนวนผู้ป่วยที่คลินิก จำนวนนักเรียนในกลุ่มผู้ชม จำนวนการเกิดในเมือง อายุขัย ปัจเจกบุคคลความเร็วโมเลกุล อุณหภูมิอากาศ ความคลาดเคลื่อนในการวัดค่าบางอย่าง เป็นต้น หากคุณนับลูกบอลในโกศในลักษณะเดียวกับตอนเล่นลอตเตอรี่ การนำลูกบอลออกจากโกศตามอำเภอใจจะแสดงตัวเลขที่ เป็นตัวแปรสุ่ม

มีตัวแปรสุ่มแบบไม่ต่อเนื่องและต่อเนื่อง

ตัวแปรสุ่มเรียกว่าไม่ต่อเนื่องหากใช้ชุดค่าที่นับได้:จำนวนตัวอักษรบนหน้าหนังสือตามอำเภอใจ พลังงานของอิเล็กตรอนในอะตอม จำนวนเส้นขนบนศีรษะของบุคคล จำนวนเมล็ดพืชในหู จำนวนโมเลกุลในปริมาตรของก๊าซที่กำหนด เป็นต้น

ต่อเนื่อง ค่าสุ่มรับค่าใด ๆ ภายในช่วงเวลา:อุณหภูมิร่างกาย มวลเกรน ในหูข้าวสาลี, พิกัดของสถานที่ที่กระสุนกระทบเป้าหมาย (เราใช้กระสุนเป็นจุดวัสดุ) เป็นต้น

การกระจายตัวของตัวแปรสุ่มแบบไม่ต่อเนื่องตัวแปรสุ่มแบบไม่ต่อเนื่องจะได้รับการพิจารณาหากมีการระบุค่าที่เป็นไปได้และความน่าจะเป็นที่สอดคล้องกัน แสดงถึงตัวแปรสุ่มแบบไม่ต่อเนื่อง เอ็กซ์,ความหมายของมัน x 1 x 2 ,., และความน่าจะเป็น พี(x 1)= พี 1 พี (x 2)= หน้า 2เป็นต้น ประชากร Xและ P เรียกว่าการกระจายตัวของตัวแปรสุ่มแบบไม่ต่อเนื่อง(ตารางที่ 1).

ตารางที่ 1

ตัวแปรสุ่มคือจำนวนกีฬาในเกม "Sportlo-10" จำนวนสปีชีส์ทั้งหมดคือ 49 ระบุการแจกแจงของตัวแปรสุ่มนี้ (ตารางที่ 3)

ตารางที่ 3


ความหมาย 1 = 0 ตรงกับกรณีดังกล่าวซึ่งเหตุการณ์สามครั้งติดต่อกัน แต่ไม่ได้เกิดขึ้น ความน่าจะเป็นของเหตุการณ์ที่ซับซ้อนนี้ ตามทฤษฎีบทการคูณความน่าจะเป็น (2.6) เท่ากับ

ความหมาย ฉัน= 1 หมายถึงกรณีที่เหตุการณ์ A เกิดขึ้นในหนึ่งในสามการทดลอง โดยสูตร (2.6) เราได้รับ

ตั้งแต่ที่ ล. = 1เหตุการณ์ที่ซับซ้อนอีกสองเหตุการณ์ก็เกิดขึ้นเช่นกัน: (A และ A และ A) และ (A และ A และ A) จากนั้นจึงมีความจำเป็น โดยใช้ทฤษฎีบทการบวกความน่าจะเป็น (2.4) เพื่อให้ได้ความน่าจะเป็นทั้งหมด ล. = 1,เพิ่มนิพจน์ก่อนหน้าสามครั้ง:

ความหมาย ฉัน= 2 สอดคล้องกับกรณีที่เหตุการณ์ A เกิดขึ้นในการทดลองสองในสามการทดลอง โดยการให้เหตุผลคล้ายกับข้างต้น เราได้ความน่าจะเป็นทั้งหมดสำหรับกรณีนี้:

ที่ 1 = 3 เหตุการณ์ A ปรากฏในการทดลองทั้งสาม โดยใช้ทฤษฎีบทการคูณความน่าจะเป็น เราพบ


ที่ กรณีทั่วไปการแจกแจงทวินามกำหนดความน่าจะเป็นที่เหตุการณ์ A จะเกิดขึ้น lครั้งที่ พีการทดสอบ:

จากการสังเกตในระยะยาว การเรียกของแพทย์ไปยังบ้านที่กำหนดนั้นประมาณด้วยความน่าจะเป็น 0.5 ค้นหาความน่าจะเป็นที่ภายในหกวันจะมีการโทรหาแพทย์สี่ครั้ง พี(เอ)= 0,5, น = 6,1 = 4. T เราใช้สูตร (2.10):

ลักษณะเชิงตัวเลขของตัวแปรสุ่มแบบไม่ต่อเนื่องในหลายกรณี ร่วมกับการกระจายของตัวแปรสุ่มหรือแทนที่ ข้อมูลเกี่ยวกับปริมาณเหล่านี้สามารถระบุได้ด้วยพารามิเตอร์ตัวเลขที่เรียกว่า ลักษณะเชิงตัวเลขของตัวแปรสุ่ม ลองพิจารณาสิ่งที่พบบ่อยที่สุด

ความคาดหวังทางคณิตศาสตร์ (ค่าเฉลี่ย) ของตัวแปรสุ่มคือผลรวมของผลิตภัณฑ์ของค่าที่เป็นไปได้ทั้งหมด
เกี่ยวกับความน่าจะเป็นของค่าเหล่านี้:

ปล่อยให้มีการทดสอบจำนวนมาก พีตัวแปรสุ่มแบบไม่ต่อเนื่อง Xรับค่า x วี x 2 ,..., x นตามลำดับ ม. 1 มก...., t pครั้งหนึ่ง. ค่าเฉลี่ยคือ

ถ้า พีมีขนาดใหญ่แล้วความถี่สัมพัทธ์ เสื้อ 1 /p, เสื้อ 2 /p,... จะมีแนวโน้มที่ความน่าจะเป็นและค่าเฉลี่ย - ความคาดหวังทางคณิตศาสตร์ นั่นคือเหตุผลที่การคาดหมายทางคณิตศาสตร์มักถูกระบุด้วยค่าเฉลี่ย

ค้นหาการคาดหมายทางคณิตศาสตร์สำหรับตัวแปรสุ่มแบบไม่ต่อเนื่อง ซึ่งกำหนดโดยตัวเลขบนขอบเมื่อโยนลูกเต๋า (ดูตารางที่ 2)

เราใช้สูตร (2.11):

ค้นหาความคาดหวังทางคณิตศาสตร์สำหรับตัวแปรสุ่มแบบไม่ต่อเนื่อง ซึ่งกำหนดโดยการหมุนเวียนของ "Sportloto" (ดูตารางที่ 3) ตามสูตร (2.11) เราพบว่า


ค่าที่เป็นไปได้ของตัวแปรสุ่มแบบไม่ต่อเนื่องจะกระจัดกระจายไปตามการคาดหมายทางคณิตศาสตร์ ซึ่งบางค่าก็เกิน ม(X),ส่วนน้อย เอ็ม(เอ็กซ์).จะประเมินระดับการกระจายตัวของตัวแปรสุ่มที่สัมพันธ์กับค่าเฉลี่ยได้อย่างไร อาจดูเหมือนว่าในการแก้ปัญหาดังกล่าว เราควรคำนวณค่าเบี่ยงเบนของตัวแปรสุ่มทั้งหมดจากการคาดหมายทางคณิตศาสตร์ X - ม(X),แล้วหาค่าคาดหมายทางคณิตศาสตร์ (ค่าเฉลี่ย) ของการเบี่ยงเบนเหล่านี้: เอ็ม[X - เอ็ม(X)].หากไม่มีหลักฐาน เราสังเกตว่าค่านี้เท่ากับศูนย์ เนื่องจากความเบี่ยงเบนของตัวแปรสุ่มจากการคาดหมายทางคณิตศาสตร์มีทั้งค่าบวกและค่าลบ ดังนั้นจึงแนะนำให้คำนึงถึงค่าสัมบูรณ์ของการเบี่ยงเบน เอ็ม[เอ็กซ์ - เอ็ม(X)] หรือสี่เหลี่ยมของพวกเขา เอ็ม[X - เอ็ม(X)] 2 .ตัวเลือกที่สองกลายเป็นตัวเลือกที่ดีกว่า ดังนั้นพวกเขาจึงมาถึงแนวคิดของความแปรปรวนของตัวแปรสุ่ม

การกระจายตัวของตัวแปรสุ่มคือการคาดหมายทางคณิตศาสตร์ของค่าเบี่ยงเบนกำลังสองของตัวแปรสุ่มจากการคาดหมายทางคณิตศาสตร์:


หมายความว่าความแปรปรวนเท่ากับผลต่างระหว่างความคาดหวังทางคณิตศาสตร์ของกำลังสองของตัวแปรสุ่ม Xและกำลังสองของความคาดหวังทางคณิตศาสตร์

ค้นหาความแปรปรวนของตัวแปรสุ่ม ซึ่งกำหนดโดยตัวเลขบนขอบเมื่อโยนลูกเต๋า (ดูตารางที่ 2)

ความคาดหวังทางคณิตศาสตร์ของการแจกแจงนี้คือ 3.5 ลองเขียนกำลังสองของการเบี่ยงเบนของตัวแปรสุ่มจากการคาดหมายทางคณิตศาสตร์: (1 - 3.5) 2 = 6.25; (2 - 3.5) 2 = 2.25; (3 - 3.5) 2 = 0.25; (4 - 3.5) 2 = 0.25; (5 - 3.5) 2 = 2.25; (6 - 3.5) 2 = 6.25 ตามสูตร (2.12) โดยคำนึงถึง (2.11) เราพบการกระจาย:

จาก (2.12) ความแปรปรวนมีมิติของกำลังสองของมิติของตัวแปรสุ่ม ในการประมาณระยะทางของตัวแปรสุ่มในหน่วยที่มีมิติเดียวกัน แนวคิดนี้จึงถูกนำมาใช้ ส่วนเบี่ยงเบนมาตรฐาน,โดยที่หมายถึง รากที่สองจากการกระจายตัว:

การกระจายและลักษณะของตัวแปรสุ่มแบบต่อเนื่อง ไม่สามารถระบุตัวแปรสุ่มแบบต่อเนื่องโดยกฎการแจกแจงแบบเดียวกันกับตัวแปรที่ไม่ต่อเนื่อง ในกรณีนี้ ให้ดำเนินการดังนี้

ให้ dP เป็นความน่าจะเป็นที่ตัวแปรสุ่มต่อเนื่อง Xใช้ค่าระหว่าง Xและ X+ ดีเอ็กซ์เห็นได้ชัดว่า Irm มีช่วงเวลามากกว่า ดีเอ็กซ์,มีโอกาสมากขึ้น dP: dP ~ dxนอกจากนี้ ความน่าจะเป็นยังต้องขึ้นอยู่กับค่าสุ่มด้วย ซึ่งใกล้กับช่วงเวลานั้น ดังนั้น

ที่ไหน เอฟ(x)- ความหนาแน่นของความน่าจะเป็นหรือ ฟังก์ชันการกระจายความน่าจะเป็นมันแสดงให้เห็นว่าความน่าจะเป็นที่เกี่ยวข้องกับช่วงเวลาเปลี่ยนแปลงไปอย่างไร dxตัวแปรสุ่ม ขึ้นอยู่กับค่าของตัวแปรนี้เอง:

การรวมนิพจน์ (2.15) ภายในขอบเขตที่เหมาะสม เราพบความน่าจะเป็นที่ตัวแปรสุ่มใช้ค่าบางค่าในช่วงเวลา (ab):

เงื่อนไขการทำให้เป็นมาตรฐานสำหรับตัวแปรสุ่มแบบต่อเนื่องมีรูปแบบ

ดังจะเห็นได้จาก (2.19) ฟังก์ชันนี้เท่ากับความน่าจะเป็นที่ตัวแปรสุ่มรับค่าน้อยกว่า เอ็กซ์:

สำหรับตัวแปรสุ่มแบบต่อเนื่อง ความคาดหวังทางคณิตศาสตร์และความแปรปรวนจะถูกเขียนตามลำดับ เช่น

คำนิยาม. ตัวแปรสุ่มเป็นตัวแปรที่ผลของการทดลองใช้ค่าใดค่าหนึ่งจากชุดของค่าที่เป็นไปได้ และไม่สามารถคาดเดาได้ว่าค่าใดก่อนการทดลอง

ตัวแปรสุ่ม เช่น จำนวนคะแนนที่หลุดออกมาเมื่อโยนลูกเต๋า จำนวนผู้มาเยี่ยมร้านขายยาในระหว่างวัน จำนวนแอปเปิ้ลบนต้นไม้ เป็นต้น

ตัวแปรสุ่มยังเป็นอุณหภูมิของผู้ป่วยในช่วงเวลาที่เลือกแบบสุ่มของวัน มวลของยาเม็ดที่เลือกแบบสุ่มของยาบางชนิด ความสูงของนักเรียนที่เลือกแบบสุ่ม เป็นต้น

โอ

อย่างไรก็ตาม จากมุมมองทางคณิตศาสตร์ จะมีความแตกต่างพื้นฐานระหว่างตัวแปรสุ่ม เช่น จำนวนผู้เข้าร้านยาในระหว่างวัน (ให้เราระบุตัวแปรสุ่ม X 1) และการเติบโตของนักเรียนที่สุ่มเลือกจาก นักเรียนบางกลุ่ม (ค่า X 2) กล่าวคือ: สำหรับค่า X 1 คุณสามารถระบุค่าที่เป็นไปได้ทั้งหมด (1, 2, 3, 4, 5, 6, ...) ในขณะที่สำหรับ ค่า X 2 สิ่งนี้ไม่สามารถทำได้เนื่องจากค่านี้ซึ่งเป็นผลมาจากการวัดสามารถนำค่าใด ๆ จากส่วนนั้น

และ - ตามลำดับ ความสูงต่ำสุดและสูงสุดของนักเรียนในกลุ่ม

ตัวแปรสุ่มมักจะแสดงด้วยตัวพิมพ์ใหญ่ของตัวอักษรละติน - X, Y, Z และอื่น ๆ และค่าที่เป็นไปได้ - โดยตัวพิมพ์เล็กที่เกี่ยวข้องพร้อมดัชนีตัวเลข ตัวอย่างเช่น ค่าของตัวแปรสุ่ม x แสดงดังนี้: x 1, x 2, x 3 เป็นต้น

แนวคิดของตัวแปรสุ่มแบบไม่ต่อเนื่องและต่อเนื่อง

คำนิยาม. ตัวแปรสุ่มเรียกว่าไม่ต่อเนื่องหากชุดของค่าที่เป็นไปได้ทั้งหมดเป็นชุดค่าที่ จำกัด หรือไม่มีที่สิ้นสุด แต่จำเป็นต้องนับได้เช่น ชุดดังกล่าวองค์ประกอบทั้งหมดสามารถเป็นตัวเลข (อย่างน้อยในทางทฤษฎี) และเขียนออกมาใน ลำดับที่เหมาะสม

คำนิยาม. ตัวแปรสุ่มเรียกว่า ต่อเนื่อง ถ้าชุดของค่าที่เป็นไปได้คือช่วงที่จำกัดหรืออนันต์ของแกนตัวเลข

ตามคำจำกัดความเหล่านี้ ตัวแปรสุ่มดังกล่าวที่ระบุไว้ข้างต้นเป็นจำนวนคะแนนที่หลุดออกมาเมื่อโยนลูกเต๋า จำนวนผู้มาร้านขายยาในระหว่างวัน จำนวนแอปเปิ้ลต่อผล ต้นไม้ เป็นตัวแปรสุ่มแบบไม่ต่อเนื่องกัน และเช่น อุณหภูมิของผู้ป่วย ณ เวลาที่กำหนดของวัน มวลของยาเม็ดที่สุ่มเลือกโดยยาบางชนิด ความสูงของนักเรียนที่เลือกแบบสุ่ม เป็นตัวแปรต่อเนื่อง

ตัวแปรสุ่มแบบไม่ต่อเนื่อง

มาดูกันดีกว่า ตัวแปรสุ่มแบบไม่ต่อเนื่องและตามกฎแล้วเราจะ จำกัด การพิจารณาตัวแปรสุ่มดังกล่าวซึ่งจำนวนค่าที่เป็นไปได้มี จำกัด

ข้อมูลที่สมบูรณ์ที่สุดเกี่ยวกับตัวแปรสุ่มแบบไม่ต่อเนื่องจะได้รับจากกฎการแจกแจงของตัวแปรนี้

คำนิยาม. กฎการกระจายของตัวแปรสุ่มแบบไม่ต่อเนื่องคือความสอดคล้องระหว่างค่าที่เป็นไปได้ทั้งหมดของตัวแปรสุ่มนี้กับความน่าจะเป็นที่สอดคล้องกัน

กฎการกระจายของตัวแปรสุ่มแบบไม่ต่อเนื่องมักจะกำหนดในรูปแบบของตารางสองบรรทัด แถวแรกซึ่งแสดงรายการค่าที่เป็นไปได้ทั้งหมดของตัวแปรนี้ (ตามกฎในลำดับจากน้อยไปมาก) และที่สอง - ความน่าจะเป็นที่สอดคล้องกับค่าเหล่านี้ตารางที่ 1:

ตัวอย่าง 2มีนักเรียนสิบกลุ่ม โดยมีนักเรียน 12, 10, 11, 8, 12, 9, 10, 8, 10 และ 11 คนตามลำดับ เขียนกฎการกระจายสำหรับตัวแปรสุ่ม X ซึ่งกำหนดเป็นจำนวนนักเรียนในกลุ่มสุ่มเลือก

วิธีการแก้. ค่าที่เป็นไปได้ของตัวแปรสุ่มที่พิจารณา X มีดังต่อไปนี้ (ในลำดับจากน้อยไปมาก):

8, 9, 10, 11 และ 12.

เนื่องจากตัวแปรสุ่ม X ใช้ค่าเท่ากับ 8 ในกรณีที่กลุ่มสุ่มเลือกเป็นกลุ่มนักเรียน 8 คน (เรียกว่าเหตุการณ์ A) ความน่าจะเป็นที่ตัวแปรสุ่ม X จะรับค่า
เท่ากับความน่าจะเป็นของเหตุการณ์สุ่มนี้:
.

ความน่าจะเป็นของเหตุการณ์สุ่ม A ตามคำจำกัดความคลาสสิกของความน่าจะเป็นคือ
เพราะจาก 10 กลุ่ม สองกลุ่มมีนักเรียน 8 คน

ดังนั้น สำหรับความน่าจะเป็นของค่า เราได้รับ:

.

ในทำนองเดียวกัน คุณสามารถค้นหาความน่าจะเป็นของค่าที่เหลือของตัวแปรสุ่ม X:

ซึ่งช่วยให้เราเขียนกฎหมายการจำหน่ายที่ต้องการได้ (ตารางที่ 2):

กฎการแจกแจงของตัวแปรสุ่มแบบไม่ต่อเนื่องสามารถระบุได้โดยใช้สูตรที่อนุญาตให้แต่ละค่าที่เป็นไปได้ของตัวแปรนี้กำหนดความน่าจะเป็นที่สอดคล้องกัน

ตัวแปรสุ่มแบบไม่ต่อเนื่องและต่อเนื่อง

ตามกฎแล้วในการผลิตผลิตภัณฑ์กระบวนการผลิตได้รับอิทธิพลจากปัจจัยต่าง ๆ อันเป็นผลมาจากค่าของตัวบ่งชี้คุณภาพของผลิตภัณฑ์มีความกระจัดกระจาย ดังนั้น ตัวชี้วัดคุณภาพของผลิตภัณฑ์หรือบริการที่ผลิตควรถือเป็นตัวแปรสุ่ม

ตัวแปรสุ่ม ค่าดังกล่าวเรียกว่าซึ่งเป็นผลมาจากการทดสอบภายในช่วงเวลาหนึ่งสามารถรับค่าตัวเลขต่างๆได้ (ตาม STB GOST R 50779.10 ตัวแปรสุ่มคือตัวแปรที่สามารถรับค่าใด ๆ จากชุดค่าที่กำหนดและเชื่อมโยงกับการกระจายความน่าจะเป็น).

ตัวแปรสุ่มแบบไม่ต่อเนื่อง เรียกว่าค่าที่แยกได้เฉพาะค่าที่แยกจากกันและไม่สามารถใช้ค่ากลางระหว่างกันได้ ตัวอย่างเช่น จำนวนชิ้นส่วนที่เสียในชุดงานสามารถเป็นจำนวนเต็มบวก 1, 2, 3 ฯลฯ เท่านั้น แต่ไม่สามารถเป็น 1.3 ได้ 1.7 เป็นต้น

ตัวแปรสุ่มต่อเนื่อง ค่าดังกล่าวเรียกว่าซึ่งจากการทดสอบสามารถนำค่าตัวเลขใด ๆ จากชุดค่าที่เป็นไปได้อย่างต่อเนื่องภายในช่วงเวลาหนึ่ง ๆ

ตัวอย่างเช่น ขนาดจริงของชิ้นส่วนที่กลึงเป็นตัวแปรสุ่มของประเภทต่อเนื่อง เนื่องจากสามารถใช้ค่าตัวเลขใดๆ ภายในขอบเขตที่กำหนดได้

ความเป็นไปได้ของตัวแปรสุ่มในการรับค่าตัวเลขบางอย่างในระหว่างการทดสอบจะถูกประเมินโดยใช้ความน่าจะเป็น

ชุดค่าของตัวแปรสุ่มที่จัดเรียงจากน้อยไปมากพร้อมบ่งชี้ความน่าจะเป็นสำหรับแต่ละค่าเรียกว่า การกระจายตัวของตัวแปรสุ่ม (ตาม STB GOST R 50779.10 การแจกแจงเป็นฟังก์ชันที่กำหนดความน่าจะเป็นที่ตัวแปรสุ่มจะใช้ค่าที่กำหนดหรือจะเป็นของชุดค่าที่กำหนด)

การกระจายของตัวแปรสุ่มสามารถนำเสนอในรูปแบบตาราง แบบกราฟิก และด้วยความช่วยเหลือของการประมาณทางสถิติ

เมื่อนำเสนอการแจกแจงตัวแปรสุ่มในรูปแบบตาราง แต่ละจำนวนของหน่วยการผลิตที่ศึกษา (หมายเลขการวัด) จะสอดคล้องกับค่าของตัวบ่งชี้คุณภาพสำหรับหน่วยการผลิตนี้ (ผลการวัด)

เมื่อนำเสนอการแจกแจงตัวแปรสุ่มในรูปแบบกราฟิก กราฟการแจกแจงจะถูกพล็อตในพิกัด ค่าของตัวแปรสุ่ม - ความน่าจะเป็น (ความถี่ ความถี่) ของค่าของตัวแปรสุ่ม

รูปด้านล่างแสดงกราฟของการแจกแจงตัวแปรสุ่มแบบไม่ต่อเนื่องและต่อเนื่อง

รูป - กราฟการแจกแจงตัวแปรสุ่มแบบไม่ต่อเนื่อง

รูป - กราฟการแจกแจงตัวแปรสุ่มต่อเนื่อง

มีการแจกแจงตัวแปรสุ่มตามทฤษฎีและเชิงประจักษ์ ในการแจกแจงทางทฤษฎี การประเมินค่าที่เป็นไปได้ของตัวแปรสุ่มจะดำเนินการโดยใช้ความน่าจะเป็นและการแจกแจงเชิงประจักษ์โดยใช้ความถี่หรือความถี่ที่ได้รับจากการทดสอบ

เพราะเหตุนี้, การแจกแจงเชิงประจักษ์ของตัวแปรสุ่ม คือ เซตของค่าทดลอง เรียงจากน้อยไปหามาก ระบุความถี่หรือความถี่ของแต่ละค่า (ตาม STB GOST R 50779.10 การกระจายความถี่ คือความสัมพันธ์เชิงประจักษ์ระหว่างค่าของคุณลักษณะและความถี่หรือความถี่สัมพัทธ์)

โต๊ะ. ตัวอย่างการแสดงตารางของการแจกแจงทางทฤษฎีของตัวแปรสุ่มแบบไม่ต่อเนื่อง

ในทางกราฟ การแจกแจงเชิงประจักษ์ของตัวแปรสุ่มแบบไม่ต่อเนื่องสามารถแสดงเป็น แผนภูมิแท่ง เกิดจากชุดคอลัมน์ที่มีความกว้างเท่ากัน ซึ่งความสูงเป็นสัดส่วนกับความถี่ของค่าที่ไม่ต่อเนื่องของตัวแปรสุ่ม

รูป - แผนภูมิแท่งของตัวแปรสุ่มแบบไม่ต่อเนื่อง

หากตัวแปรสุ่มเป็นแบบต่อเนื่อง ปัญหาบางอย่างจะเกิดขึ้นกับการนำเสนอการแจกแจงในรูปแบบของตารางหรือกราฟ ดังนั้นในทางปฏิบัติเมื่อศึกษาตัวแปรสุ่มประเภทต่อเนื่อง ค่าที่ได้รับจะถูกแบ่งออกเป็นช่วงที่เท่ากันเพื่อให้ค่าของช่วงเวลาค่อนข้างมากกว่าข้อผิดพลาดในการวัดของปริมาณที่ศึกษา จากนั้นความถี่จะไม่คำนวณโดยค่าจริงของตัวแปรสุ่ม แต่ตามช่วงเวลา ดังนั้นตารางการแจกแจงเชิงประจักษ์ของตัวแปรสุ่มประเภทต่อเนื่องจะมีรูปแบบดังนี้

โต๊ะ. การกระจายเชิงประจักษ์ของตัวแปรสุ่มประเภทต่อเนื่อง

ช่วงค่า X

ค่าเฉลี่ยเลขคณิต

ความถี่ ผม

ความถี่ ผม

160,031 - 160,033

160,033 - 160,035

160,035 - 160,037

160,037 - 160,039

160,039 - 160,041

160,041 - 160,043

160,043 - 160,045

160,045 - 160,047

ผม = 100

ผม = 1

การแจกแจงเชิงประจักษ์ของตัวแปรสุ่มต่อเนื่องแบบสุ่มสามารถแสดงเป็นภาพกราฟิกเป็นฮิสโตแกรมการแจกแจง รูปหลายเหลี่ยมความถี่ หรือรูปหลายเหลี่ยมความถี่สะสม

ฮิสโตแกรมการกระจาย คือชุดของสี่เหลี่ยมสัมผัส ฐานซึ่งเท่ากับช่วงเวลาของการแยกตัวแปรสุ่มอย่างต่อเนื่องและพื้นที่เป็นสัดส่วนกับความถี่ที่ค่าของตัวแปรสุ่มตกอยู่ในช่วงเวลาเหล่านี้ (ตาม STB GOST R 50779.10 แผนภูมิแท่ง (การกระจาย) คือการแสดงกราฟิกของการแจกแจงความถี่สำหรับคุณลักษณะเชิงปริมาณ ซึ่งเกิดขึ้นจากสี่เหลี่ยมที่ต่อเนื่องกัน ฐานซึ่งเป็นช่วงของคลาส และพื้นที่เป็นสัดส่วนกับความถี่ของคลาสเหล่านี้)

รูป - ฮิสโตแกรมของการแจกแจงตัวแปรสุ่มต่อเนื่อง

รูปหลายเหลี่ยมความถี่ เป็นเส้นที่ขาดจากจุดเชื่อมต่อที่มี abscissas เท่ากับจุดกึ่งกลางของช่วงการแบ่งพาร์ติชั่น และพิกัดจะเท่ากับความถี่ที่สอดคล้องกัน

รูป - รูปหลายเหลี่ยมของความถี่ของตัวแปรสุ่มต่อเนื่องกัน

รูปหลายเหลี่ยมสะสม ความถี่ เป็นเส้นที่ขาดซึ่งได้มาจากจุดเชื่อมต่อที่มี abscissas เท่ากับขอบเขตบนของช่วงการแบ่งพาร์ติชั่น และมีค่าพิกัดเท่ากับความถี่สะสมหรือความถี่สะสม (ความถี่สัมพัทธ์สะสม)

รูป - รูปหลายเหลี่ยมของความถี่สะสมของค่าต่อเนื่องแบบสุ่ม

ในคำอธิบายเชิงทฤษฎีของตัวแปรสุ่มของประเภทต่อเนื่อง ฟังก์ชันการแจกแจงจะถูกใช้ การแจกแจงตามทฤษฎีของตัวแปรสุ่มต่อเนื่องกันสามารถแสดงเป็นภาพกราฟิกได้เป็น ปริพันธ์, อินทิกรัลผกผัน, ดิฟเฟอเรนเชียลฟังก์ชันและฟังก์ชันการกระจาย ความเข้ม.

ให้ X เป็นตัวแปรสุ่ม และ x เป็นจำนวนจริงบางส่วน (ด้วย X< х ). เหตุการณ์ X< х отвечает вероятность Р(Х < х), которая является функцией F(х), т.е.

P(X .)< х) = F(х)

F(X) เรียกว่า ฟังก์ชันการกระจาย ความน่าจะเป็น ฟังก์ชันการแจกแจงตัวแปรสุ่มหรืออินทิกรัล

สำหรับตัวแปรสุ่มแบบไม่ต่อเนื่อง ฟังก์ชันการแจกแจงอินทิกรัล F(X) ถูกกำหนดอย่างง่ายดายจากตารางหรือกราฟ

ดังนั้น สำหรับตัวอย่างข้างต้นของการแจกแจงตัวแปรสุ่มแบบไม่ต่อเนื่อง (ที่ X< 4):

ฉ(X) = พี( X ) = ป( X=1) + พี( X=2) + พี( X=3) = 1/30 + 4/30 +15/30 = 19/30

กราฟของฟังก์ชันการกระจายอินทิกรัลของตัวแปรสุ่มแบบไม่ต่อเนื่องจะมีลักษณะเป็นเส้นโค้งขั้น พิกัดของเส้นโค้งสำหรับค่าใดๆ ของ X จะแทนผลรวมของความน่าจะเป็นของค่าก่อนหน้า

รูป - ฟังก์ชันการกระจายแบบอินทิกรัลของตัวแปรสุ่มแบบไม่ต่อเนื่อง

ความน่าจะเป็นที่ตัวแปรสุ่มระหว่างการทดสอบจะอยู่ภายในขอบเขตของค่าที่กำหนดสองค่า x 1 และ x 2 (x 2 > x 1) เท่ากับการเพิ่มของฟังก์ชันอินทิกรัลในพื้นที่นี้คือ

P(x .) 1 ≤ X ≤ x 2 ) = P(X< х 2 ) - P(X< х 1 ) = F(X 2 ) - F(X .) 1 )

หากเราหันไปที่ตัวอย่างข้างต้นของการแจกแจงตัวแปรสุ่มแบบไม่ต่อเนื่อง สำหรับ x1 = 2 และ x2 = 3:

P(2≤X≤3) = P(X .)< 3) - Р(Х < 2)= F(Х2) - F(Х1)= 4/30-1/30 = 3/30

สำหรับตัวแปรสุ่มแบบต่อเนื่อง กราฟของฟังก์ชันการกระจายอินทิกรัลจะมีลักษณะเป็นเส้นโค้งที่เพิ่มขึ้นแบบโมโนโทน ในทางปฏิบัติ ความถี่การแจกแจงตามทฤษฎีถูกกำหนดโดยใช้ฟังก์ชันการแจกแจงสะสม

รูป - ฟังก์ชันการกระจายสะสม

ตัวแปรสุ่มต่อเนื่อง

ฟังก์ชันการกระจายสะสมแบบผกผันเท่ากับผลต่างระหว่างเอกภาพและฟังก์ชันการกระจายสะสม

ความหนาแน่นของการกระจาย (ฟังก์ชันการกระจายส่วนต่าง) ตัวแปรสุ่มเรียกว่าอนุพันธ์อันดับแรกของฟังก์ชันการกระจายอินทิกรัล:

สำหรับคำอธิบายเชิงวิเคราะห์ของตัวแปรสุ่มอย่างต่อเนื่องในทฤษฎีความน่าเชื่อถือ เราใช้ ฟังก์ชันความเข้ม เท่ากับอัตราส่วนของฟังก์ชันการแจกแจงส่วนต่างต่อฟังก์ชันการกระจายอินทิกรัลแบบผกผัน:

รูป - ฟังก์ชันความเข้มของตัวแปรสุ่มแบบต่อเนื่อง

หัวข้อที่ 3

ตัวแปรสุ่มและฟังก์ชันการกระจาย

แนวคิดของตัวแปรสุ่ม

แนวคิดของตัวแปรสุ่ม

ฟังก์ชันการกระจายของตัวแปรสุ่ม คุณสมบัติของมัน

ตัวแปรสุ่มพร้อมการกระจายแบบไม่ต่อเนื่อง

แนวคิดของตัวแปรสุ่มที่มีการแจกแจงแบบแยกส่วน

กฎการกระจายตัวของตัวแปรสุ่มแบบไม่ต่อเนื่อง

ตัวอย่างของการแจกแจงแบบไม่ต่อเนื่อง

ตัวแปรสุ่มที่มีการแจกแจงต่อเนื่องอย่างแน่นอน

แนวคิดของตัวแปรสุ่มที่มีการแจกแจงต่อเนื่องอย่างแน่นอน

กฎการกระจายของตัวแปรสุ่มแบบต่อเนื่องโดยสิ้นเชิง ความหนาแน่นคุณสมบัติของมัน

ตัวอย่างของการแจกแจงต่อเนื่องอย่างแน่นอน

แนวคิดของเวกเตอร์สุ่ม

แนวคิดของเวกเตอร์สุ่ม

ตัวแปรสุ่มอิสระ

การกระจายร่วมของตัวแปรสุ่ม

แนวคิดของตัวแปรสุ่ม

ตั้งแต่กำเนิดทฤษฎีความน่าจะเป็น ภารกิจหลักของมันคือการศึกษาไม่ใช่คุณสมบัติความน่าจะเป็นของการทดลองด้วยผลลัพธ์แบบสุ่ม แต่ปริมาณเชิงตัวเลขที่เกี่ยวข้องกับการทดลองเหล่านี้ซึ่งเป็นเรื่องปกติที่จะเรียก ตัวแปรสุ่ม. ตัวอย่างเช่น เราอาจไม่สนใจคู่ของตัวเลขที่อยู่ด้านบนของลูกเต๋า แต่ในผลรวมของตัวเลขนั้น จำนวนความสำเร็จหรือความล้มเหลวก่อนความสำเร็จครั้งแรกในโครงการเบอร์นูลลี

บ่อยครั้งในวรรณคดี คุณสามารถหารูปแบบต่าง ๆ ในรูปแบบของคำจำกัดความต่อไปนี้: ตัวแปรสุ่มเรียกว่าตัวแปรที่ขึ้นอยู่กับผลของการทดสอบซึ่งรับค่าที่ขึ้นอยู่กับกรณี

ดังนั้น ตัวแปรสุ่มจึงเป็นค่าตัวเลข ซึ่งค่านั้นขึ้นอยู่กับว่าผลลัพธ์ (ระดับประถมศึกษา) ประเภทใดที่เกิดขึ้นจากการทดสอบผลลัพธ์แบบสุ่ม ชุดของค่าทั้งหมดที่ตัวแปรสุ่มสามารถรับได้เรียกว่า ชุดค่าที่เป็นไปได้ของตัวแปรสุ่มนี้

เราจะให้คำจำกัดความที่เข้มงวดยิ่งขึ้น เนื่องจากแนวคิดของตัวแปรสุ่มเป็นหนึ่งในแนวคิดหลักที่เชื่อมโยงทฤษฎีความน่าจะเป็นกับการวิเคราะห์ทางคณิตศาสตร์ และสร้างพื้นฐานแนวคิดของสถิติทางคณิตศาสตร์

คำนิยาม. ตัวแปรสุ่มเป็นฟังก์ชัน X = X(ω) ที่กำหนดในช่องว่างของเหตุการณ์เบื้องต้น Ω ที่เหตุการณ์นั้น (X< х} = {ω: Х(ω) < х} принадлежит σ-алгебре событий A для любого вещественного х.

สภาพ (X< х} єA дает возможность рассматривать вероятности событий {Х < х}, поскольку вероятности определены только на множествах из แต่. นอกจากนี้ ผ่านเหตุการณ์ (X< х}, х є (-∞, ∞) с помощью известных операций над событиями можно выразить сколь угодно сложное событие, связанное со случайной величиной Х. Такое событие также будет принадлежать σ-алгебре событий A и, следовательно, для него определена вероятность.

ความคิดเห็น ดังนั้น ตัวแปรสุ่มคือฟังก์ชันที่มีโดเมนของคำจำกัดความคือช่องว่างของเหตุการณ์เบื้องต้น Ω และชุดของค่าเป็นชุดตัวเลข อาจเป็นชุดของจำนวนจริงทั้งหมด R.

σ-พีชคณิตของเหตุการณ์ A คือโดเมนของคำจำกัดความของความน่าจะเป็น หากเราพิจารณาว่าเป็นฟังก์ชัน

ความคิดเห็น . “คำว่า “ตัวแปรสุ่ม” ค่อนข้างจะคลาดเคลื่อน คำว่า “ฟังก์ชันโอกาส” จะเหมาะสมกว่า ตัวแปรอิสระเป็นจุดในพื้นที่ของเหตุการณ์เบื้องต้น กล่าวคือ ผลของการทดลองหรือกรณี (W. Feller "บทนำสู่ทฤษฎีความน่าจะเป็น", ch. ทรงเครื่อง)

ตัวแปรสุ่มแสดงด้วยตัวอักษรของตัวอักษรกรีก:  (xi),  (นี่),  หรือตัวพิมพ์ใหญ่ของตัวอักษรละติน X, Y, ... เราจะเขียนค่าของตัวแปรสุ่มเป็น ลำดับจำกัดหรืออนันต์ x 1 ,x 2 ,, x ,; y 1 ,y 2 ,,y ,

ความคิดเห็น . ก่อนหน้านี้เราได้แนะนำแนวคิดเรื่องความน่าจะเป็นที่เกี่ยวข้องกับเหตุการณ์บางอย่าง ตอนนี้เรามาพูดถึงฟังก์ชั่นกันต่อ เหตุการณ์ที่ชัดเจนที่สุดที่สามารถเชื่อมโยงกับแนวคิดของฟังก์ชันคือการนำค่าบางอย่างไปใช้ (เฉพาะหรือเป็นของช่วงเวลา)

ในการศึกษาคุณสมบัติความน่าจะเป็นของตัวแปรสุ่ม จำเป็นต้องรู้กฎที่ช่วยให้คุณสามารถค้นหาความน่าจะเป็นที่ตัวแปรสุ่มจะรับค่าจากเซตย่อยของค่าของมัน กฎดังกล่าวเรียกว่า กฎของการแจกแจงความน่าจะเป็นหรือการแจกแจง (ความน่าจะเป็น) ของตัวแปรสุ่ม(คำว่า "น่าจะเป็น" มักจะละเว้น)

กฎการกระจายทั่วไปที่มีอยู่ในตัวแปรสุ่มทั้งหมดคือ ฟังก์ชันการกระจาย.

คำนิยาม.ความน่าจะเป็นทั้งชุด P(X< х}, х є (-∞, ∞) задает กฎการกระจายของตัวแปรสุ่ม Xโดยทั่วไป บ่อยครั้ง เพื่อความกระชับ กฎการกระจายตัวของตัวแปรสุ่มเรียกง่ายๆ ว่าการกระจายตัวของตัวแปรสุ่ม

คำนิยาม.ฟังก์ชัน F(x) = P(X< х}, х є (-∞, ∞) называется ฟังก์ชันการกระจายของตัวแปรสุ่ม X

ค่าของฟังก์ชันการกระจายที่จุด x เท่ากับความน่าจะเป็นของเหตุการณ์ (X< х}, то есть события, состоящего из тех и только тех элементарных исходов ω, для которых Х < х.

โดยปกติแล้ว ค่าของฟังก์ชันการกระจายที่จุด x เท่ากับความน่าจะเป็นที่ตัวแปรสุ่ม X จะใช้กับค่าที่น้อยกว่า x

ในเชิงเรขาคณิต นี่หมายถึงสิ่งต่อไปนี้ F(x) คือความน่าจะเป็นที่ตัวแปรสุ่ม X จะใช้ค่าที่แสดงโดยจุดบนเส้นจำนวนที่อยู่ทางด้านซ้ายของจุด x

ความคิดเห็น . ฟังก์ชันการกระจายเรียกอีกอย่างว่า ฟังก์ชันอินทิกรัล หรือกฎปริพันธ์ของการแจกแจงตัวแปรสุ่ม X

ฟังก์ชันการกระจายมีดังต่อไปนี้ คุณสมบัติ:

    0≤ F(x)≤1 (เพราะตามนิยาม ฟังก์ชันการแจกแจงคือความน่าจะเป็น)

    F(x 1) ≤ F(x 2) สำหรับ x 1< x 2 (т.е. F(x) – неубывающая функция)

    lim F(x) = 0 เป็น x → - ∞ , lim F(x) = 1 เป็น x → + ∞

    P (x 1 ≤ X ≤ x 2) = F(x 1) - F(x 2)

    F(x) เป็นฟังก์ชันต่อเนื่องทางซ้าย เช่น F(x) = F(x - 0) โดยที่ F(x - 0) = lim F(y) เป็น y → x - 0 (ขีดจำกัดด้านซ้ายมือ)

ความคิดเห็น . เพื่อเน้นว่าตัวแปรสุ่มใดที่ฟังก์ชันการกระจาย F(x) เป็นของ ฟังก์ชันนี้บางครั้งถูกกำหนดตัวห้อยเพื่อแสดงถึงตัวแปรสุ่มเฉพาะ ตัวอย่างเช่น FX (x) = P (X< х}

ความคิดเห็น ในสิ่งพิมพ์บางฉบับ ฟังก์ชันการกระจายถูกกำหนดเป็น F(x) = P(X ≤ x) คำจำกัดความดังกล่าวไม่ได้เปลี่ยนแปลงอะไรเลยในสาระสำคัญของแนวคิดของฟังก์ชันการกระจาย เฉพาะคุณสมบัติสุดท้ายที่ห้าเท่านั้นที่เปลี่ยนแปลง ฟังก์ชันในกรณีนี้กลายเป็นแบบต่อเนื่องทางขวา

การพูดนอกเรื่อง: "ฟังก์ชั่นคืออะไร"

ให้เราได้สองชุด X และ Y และ Y เป็นชุดตัวเลข และให้กฎ f ถูกกำหนดตามที่แต่ละองค์ประกอบ (จุด) ของชุด X เชื่อมโยงกับ (หนึ่งและเดียวเท่านั้น) องค์ประกอบ (ตัวเลข) ของชุด Y กฎ f ร่วมกับชุด X และ Y กำหนด ฟังก์ชันฉ สัญกรณ์ y=f(x) หมายความว่ากฎ f ถูกนำไปใช้กับบางจุด x ของเซต X และเป็นผลให้เราได้รับจุด y จากเซต Y X เรียกว่าอาร์กิวเมนต์ (ตัวแปรอิสระ) และ y คือค่า (ตัวแปรตาม) ของฟังก์ชัน f ที่จุด X เซต X เรียกว่า โดเมนของนิยาม (setting area) ของฟังก์ชัน เขาว่ากันว่าให้ฟังก์ชันในเซตนี้ เซต Y เรียกว่า เซตของค่าของฟังก์ชัน ชุด X ไม่จำเป็นต้องเป็นชุดตัวเลข ดังนั้น ตัวแปรสุ่มจึงเป็นฟังก์ชันที่กำหนดไว้ในช่องว่างที่ไม่ใช่ตัวเลขของเหตุการณ์พื้นฐาน

ค่าสุ่ม

ค่าสุ่มคือปริมาณที่เป็นผลจากการทดสอบ จะใช้ค่าที่เป็นไปได้เพียงหนึ่งค่าเท่านั้น และค่าใดไม่ทราบล่วงหน้า

ไม่ต่อเนื่องเป็นตัวแปรสุ่มที่ใช้ค่าที่เป็นไปได้แยกจากกันโดยมีความน่าจะเป็นที่แน่นอน

ตัวแปรต่อเนื่องคือตัวแปรสุ่มที่สามารถรับค่าทั้งหมดจากช่วงจำกัดหรืออนันต์บางช่วงได้

กฎการกระจายของตัวแปรสุ่มแบบไม่ต่อเนื่องคือความสอดคล้องระหว่างค่าที่เป็นไปได้ของตัวแปรสุ่มกับความน่าจะเป็น กฎหมายฉบับนี้กำหนดไว้ในรูปแบบของตาราง สูตร หรือกราฟ

สำหรับตัวแปรสุ่มแบบไม่ต่อเนื่อง ตัวแปรที่พบบ่อยที่สุดคือกฎการแจกแจงทวินามที่เรียกว่ากฎการแจกแจงทวินาม ซึ่งรูปแบบการทดสอบซ้ำของเบอร์นูลลีนำไปสู่ สูตร (8) คือนิพจน์เชิงวิเคราะห์ของกฎหมายนี้

ตัวอย่าง 11.

ข้อความถูกส่งผ่านช่องทางการสื่อสารโดยใช้รหัสที่ประกอบด้วยอักขระสองตัว ความน่าจะเป็นของการปรากฏตัวของครั้งแรกคือ 2/3 สามป้ายผ่านไป ค้นหากฎการกระจายสำหรับการเกิดขึ้นของสัญญาณแรก

วิธีการแก้.

ตามเงื่อนไข =4, R=2/3, q=1/3. ค่าที่เป็นไปได้ของจำนวนครั้งของสัญญาณแรก: 0, 1, 2 และ 3 ค้นหาความน่าจะเป็นโดยใช้สูตร (8):

กฎหมายนี้สามารถนำเสนอในรูปแบบของตาราง

X
P1/27 1/27 2/9 4/9 8/27

ฟังก์ชันการแจกแจงเป็นฟังก์ชันที่กำหนดความน่าจะเป็นที่ตัวแปรสุ่ม Xเนื่องจากผลการทดสอบจะมีค่าน้อยกว่า เอ็กซ์,นั่นคือ

ในทางเรขาคณิต นี่หมายความว่าตัวแปรสุ่มที่มีความน่าจะเป็น Rจะใช้ค่าที่แสดงบนแกนตัวเลขโดยชี้ไปทางซ้าย เอ็กซ์

สำหรับตัวแปรสุ่มแบบต่อเนื่อง ฟังก์ชันการแจกแจงเป็นฟังก์ชันดิฟเฟอเรนเชียลแบบแยกส่วนแบบต่อเนื่อง คุณสมบัติหลักมาจากคำจำกัดความ:

1. ค่าของฟังก์ชันการกระจายอยู่ในเซ็กเมนต์ เช่น

2. F(x) เป็นฟังก์ชันที่ไม่ลดลง นั่นคือ if

3. ความน่าจะเป็นที่ตัวแปรสุ่มใช้ค่าที่มีอยู่ในช่วง [ a,b[, เท่ากับการเพิ่มขึ้นของฟังก์ชันการกระจายในช่วงเวลานี้

สำหรับตัวแปรสุ่มแบบต่อเนื่อง ความน่าจะเป็นที่จะยอมรับค่าเดียวจะเป็นศูนย์ ดังนั้น สำหรับตัวแปรสุ่มอย่างต่อเนื่อง

ตัวอย่างที่ 12.

ค่าสุ่ม Xกำหนดโดยฟังก์ชันการกระจาย

จงหาความน่าจะเป็นที่เป็นผลจากการทดสอบ Xจะนำค่าที่เป็นของเซ็กเมนต์ [-1; 0.5]

วิธีการแก้.

เป็นไปตามเงื่อนไขที่ว่า Xเป็นตัวแปรสุ่มต่อเนื่องที่สามารถรับค่าได้ตั้งแต่ 0 ถึง 1

ความหนาแน่นของความน่าจะเป็น ต่อเนื่องตัวแปรสุ่ม Xเรียกอนุพันธ์อันดับแรกของฟังก์ชันการกระจาย

ฟังก์ชันการกระจาย เอฟ(x)เป็นหนึ่งในแอนติเดริเวทีฟสำหรับความหนาแน่นของการแจกแจง ขึ้นอยู่กับคำจำกัดความของความหนาแน่นหรือ กฎความแตกต่างการแจกแจงและความสัมพันธ์กับฟังก์ชันการแจกแจงทำให้ง่ายต่อการแสดงคุณสมบัติดังต่อไปนี้:

1. ความหนาแน่นของการแจกแจงของตัวแปรสุ่มแบบต่อเนื่องเป็นฟังก์ชันที่ไม่เป็นลบ

2. ความน่าจะเป็นที่จะตีตัวแปรสุ่ม Xในช่วงเวลาเท่ากับ

(16)

3. จากคุณสมบัติ 2 เราได้รับนิพจน์สำหรับฟังก์ชันการกระจาย

(17)

4. สภาวะปกติ

(18)

ตัวอย่างที่ 13ค่าที่ไม่ต่อเนื่อง Xให้โดยตาราง

X
R 0,1 0,3 0,4 0,2

ค้นหาฟังก์ชันการกระจายและสร้างกราฟ

วิธีการแก้.

1. ถ้า แล้ว ตั้งแต่ Xไม่ต่ำกว่า 2

ในกรณีนี้ ในช่วง (-¥, X)ตัวแปรสุ่มมีค่าเพียงค่าเดียว X (X=2). นั่นเป็นเหตุผลที่

สำหรับค่าอาร์กิวเมนต์ใด ๆ Xฟังก์ชั่น เอฟ(x),ตอบสนองความไม่เท่าเทียมกันนี้ในช่วงเวลา (-¥, X) ตีสองค่าของตัวแปรสุ่ม ( X=2 และ X=3). เพราะเหตุการณ์ที่ Xจะยอมรับค่าที่กำหนดไม่สอดคล้องกัน (หรือ X=2 หรือ X=3) แล้ว

4. ในทำนองเดียวกัน if

ดังนั้นฟังก์ชันการกระจายจะมีลักษณะดังนี้

เราสร้างกราฟของฟังก์ชันการกระจาย

ข้าว. 1 - กราฟของฟังก์ชันการกระจาย

ตัวแปรสุ่มแบบไม่ต่อเนื่อง

ตัวอย่างที่ 14. ความหนาแน่นการกระจายข้อผิดพลาดในการวัด

ตัวแปรสุ่มคือตัวแปรที่มีค่าที่ได้มาจากการคำนวณใหม่หรือการวัด และไม่สามารถกำหนดได้อย่างชัดเจนโดยเงื่อนไขของการเกิดขึ้น

นั่นคือ ตัวแปรสุ่มแสดงถึงเหตุการณ์สุ่มตัวเลข

ตัวแปรสุ่มแบ่งออกเป็นสองคลาส:

ตัวแปรสุ่มแบบไม่ต่อเนื่อง - ค่าของปริมาณเหล่านี้เป็นตัวเลขธรรมชาติ ซึ่งสัมพันธ์กับความถี่และความน่าจะเป็นในแต่ละเหตุการณ์

ตัวแปรสุ่มต่อเนื่อง - สามารถรับค่าใดก็ได้จากช่วงเวลาหนึ่ง (ช่วง) เนื่องจากมีค่าตัวเลขเป็นอนันต์ในช่วงเวลาตั้งแต่ X1 ถึง X2 ความน่าจะเป็นที่ตัวแปรสุ่มXiЄ(X1,X2) จะใช้ค่าหนึ่งจึงน้อยมาก เนื่องจากเป็นไปไม่ได้ที่จะแสดงรายการค่าทั้งหมดของตัวแปรสุ่มแบบต่อเนื่อง ในทางปฏิบัติจะใช้ค่าเฉลี่ยของช่วงเวลา (X1,X2)

สำหรับตัวแปรสุ่มแบบไม่ต่อเนื่อง ฟังก์ชัน y \u003d P (x) เรียกว่าฟังก์ชันการกระจายของตัวแปรสุ่มและมีกราฟ ซึ่งเรียกว่ารูปหลายเหลี่ยมการกระจาย

กลุ่มของลักษณะเชิงตัวเลขมีความโดดเด่น: ลักษณะตำแหน่ง (ความคาดหวังทางคณิตศาสตร์ โหมด ค่ามัธยฐาน ควอนไทล์ ฯลฯ ) การกระจาย (การกระจาย ค่าเบี่ยงเบนมาตรฐาน ฯลฯ ) ลักษณะของรูปร่างความหนาแน่นของการกระจาย (ความเบ้ ความโด่ง ฯลฯ) .

การคาดหมายทางคณิตศาสตร์ (ค่าเฉลี่ยโดยการแจกแจง) เป็นจำนวนจริง ซึ่งกำหนดโดยขึ้นอยู่กับประเภทของ SV X โดยสูตร:


การคาดหมายทางคณิตศาสตร์จะเกิดขึ้นถ้าอนุกรม (ตามลำดับ ปริพันธ์) ทางด้านขวาของสูตรมาบรรจบกันโดยสิ้นเชิง ถ้า mX = 0 แสดงว่า CV X อยู่กึ่งกลาง (แสดงด้วย )

คุณสมบัติของความคาดหวังทางคณิตศาสตร์:

โดยที่ C คือค่าคงที่

M = C×M[X];

M = M[X]+M[Y],

สำหรับ CB X และ Y;

M = M[X]×M[Y] + KXY,

โดยที่ KXY = M คือความแปรปรวนร่วมของ CV ของ X และ Y

โมเมนต์เริ่มต้นของลำดับที่ k (k = 0, 1, 2, ...) ของการแจกแจง SV X เป็นจำนวนจริงที่กำหนดโดยสูตร:

nk=M=

โมเมนต์ตรงกลางของลำดับที่ k ของการแจกแจง SV X คือตัวเลขที่กำหนดโดยสูตร:

mk = M[(X-mX)k]=

โดยเฉพาะจากคำจำกัดความของโมเมนต์ n0 = m0 = 1, n1 = mX, m2 = DX = sX2

โหมด SWNT คือจำนวนจริง Mo(X) = x* ซึ่งกำหนดเป็นจุดสูงสุดของ PR f(x) โหมดสามารถมีค่าเดียว (การแจกแจงแบบ unmodal) หรือหลายค่า (การกระจายหลายแบบ)

ค่ามัธยฐานของ SWNT คือจำนวนจริง Me(X) = x0 ที่ตรงตามเงื่อนไข: P(X< x0} = P{X ³ x0} или F(x0) = 0,5.

ควอนไทล์ระดับ p คือจำนวนจริง tp ที่ตรงกับสมการ: F(tp) = p โดยเฉพาะจากนิยามของค่ามัธยฐานว่า x0 = t0.5

ความแปรปรวนของ SV X คือจำนวนที่ไม่เป็นลบ D[X] = DX ซึ่งกำหนดโดยสูตร:

DX = M[(X-mX)2] = M - mX2 =

การกระจายตัวจะเกิดขึ้นถ้าอนุกรม (ตามลำดับ อินทิกรัล) ทางด้านขวาของความเท่าเทียมกันมาบรรจบกัน คุณสมบัติการกระจาย:

D[C] = 0 โดยที่ C เป็นค่าคงที่

D = C2×D[X];

เห็นได้ชัดว่าความแปรปรวนไม่เปลี่ยนแปลงกับอคติ CB X;

D = D[X] + D[Y] + 2×KXY,

โดยที่ KXY = M - ความแปรปรวนร่วมของ CB X และ Y;

ตัวเลขที่ไม่เป็นลบ sХ = เรียกว่าค่าเบี่ยงเบนมาตรฐานของ RV X ซึ่งมีมิติของ RV X และกำหนดช่วงการกระจายตัวของ rms มาตรฐาน ซึ่งสมมาตรเมื่อเทียบกับการคาดหมายทางคณิตศาสตร์ (ค่าของ sX บางครั้งเรียกว่าค่าเบี่ยงเบนมาตรฐาน) CV X เรียกว่าเป็นมาตรฐานถ้า mX = 0 และ sX = 1 หากค่า X = const (เช่น X ไม่ใช่แบบสุ่ม) ดังนั้น D[X] = 0

ตัวบ่งชี้ความไม่สมมาตรของ PR คือสัมประสิทธิ์ของความไม่สมมาตร ("ความเบ้") ของการแจกแจง: A = m3/s3X ตัวบ่งชี้ความโด่งของ PR คือสัมประสิทธิ์ของความโด่ง ("ความแหลม") ของการแจกแจง: E = (m4/s4X)-3 โดยเฉพาะสำหรับการแจกแจงแบบปกติ E = 0

ชุดคำสั่งของตัวแปรสุ่ม n ตัว (CV) X1, X2, ..., Xn ที่พิจารณาร่วมกันในการทดลองนี้เรียกว่า CV n-dimensional หรือเวกเตอร์สุ่มและแสดงโดย = (X1, X2, ... , Xn).

ฟังก์ชันการกระจาย (DF) ของเวกเตอร์สุ่ม n มิติคือฟังก์ชันของตัวแปรจริง n ตัว x1, x2, ..., xn ซึ่งกำหนดเป็นความน่าจะเป็นของการปฏิบัติตามร่วมกันของความไม่เท่าเทียมกัน n ตัว: F(x1, x2, ... xn) = P( X1< x1, X2 < x2,..., Xn < xn}. В частности, для двумерного случайного вектора (X, Y) по определению ФР имеем: F(x, y) = P{X < x, Y < y}. ФР F (х, у) обладает следующими свойствами:

1 0 £ F(x, y) £ 1;

2 F(x, y) - ฟังก์ชันที่ไม่ลดลงของอาร์กิวเมนต์

4.

คุณสมบัติ 4 โดยทั่วไปจะเรียกว่าเงื่อนไขความสอดคล้อง หมายความว่าสามารถหา DF ของส่วนประกอบแต่ละส่วนของเวกเตอร์สุ่มได้โดยการส่งผ่านไปยังขีดจำกัดจากฟังก์ชันการกระจายร่วมของส่วนประกอบเหล่านี้ ความน่าจะเป็นของจุดสุ่มบนระนาบ (X, Y) ที่ตกลงไปในสี่เหลี่ยมผืนผ้าที่มีด้านขนานกับแกนพิกัดสามารถคำนวณได้โดยใช้ DF โดยใช้สูตร:

P(x1 £ X< x2, y1 £ Y < y2} = F(x1, y1)+ F(x2, y2)- F(x1, y2)- F(x2, y1).

เวกเตอร์สุ่มสองมิติ (X,Y) เรียกว่าเวกเตอร์สุ่มประเภทไม่ต่อเนื่อง (RDV) หากชุดของค่าที่เป็นไปได้ G(x, y) นั้นสามารถนับได้มากที่สุด กฎการกระจายของมันสามารถระบุได้โดยตารางสองมิติจากรายการค่าที่เป็นไปได้ของคู่ของส่วนประกอบ ((хi, yi) | (хi, yi) О G(x, y)) และสอดคล้องกับแต่ละคู่ดังกล่าว ของความน่าจะเป็น pij = P(X = xi, Y = yj ) เป็นไปตามเงื่อนไข

เวกเตอร์สุ่มสองมิติ (X, Y) เรียกว่าเวกเตอร์สุ่มประเภทต่อเนื่อง (CBNT) หากมีฟังก์ชันที่ไม่เป็นลบดังกล่าว f(x, y) เรียกว่าความหนาแน่นของการแจกแจงความน่าจะเป็น (DP) ของเวกเตอร์สุ่มที่ :

f(x, y) = จากนั้น F(x, y) = .

PR ของความน่าจะเป็นมีคุณสมบัติดังต่อไปนี้:

f(x, y) ³ 0, (x, y) н R2;

คือสภาวะปกติ

PR ของความน่าจะเป็นของส่วนประกอบแต่ละส่วนของเวกเตอร์สุ่มแสดงเป็นอินทิกรัลของความหนาแน่นร่วม:

f(x) = ฉ(y) = .

ความน่าจะเป็นของจุดสุ่มที่ตกลงสู่พื้นที่กำลังสองโดยพลการ S บนระนาบถูกกำหนดโดยสูตร

P((X, Y) О S)= .

ความหนาแน่นของการแจกแจงความน่าจะเป็นแบบมีเงื่อนไขขององค์ประกอบสุ่ม X โดยมีเงื่อนไขว่าองค์ประกอบ Y มีค่าที่แน่นอน y เป็นฟังก์ชัน f(x/y) ของตัวแปรจริง x О R: f(x/y) = f(x , y)/f(y) . ในทำนองเดียวกัน ความหนาแน่นของความน่าจะเป็นแบบมีเงื่อนไขขององค์ประกอบสุ่ม Y จะถูกกำหนด โดยมีเงื่อนไขว่าองค์ประกอบ X มีค่าที่แน่นอน x: f(y/x) = f(x, y)/f(x) RVs X1, X2, ..., Xn เรียกว่าอิสระ (โดยรวม) หากสำหรับเหตุการณ์ (Xi н Bi), i = 1, 2, ..., n โดยที่ B1, B2, ... Bn เป็นเซตย่อย ของเส้นตรงที่เป็นตัวเลข มีความเท่าเทียมกันดังต่อไปนี้: P(X1 Î B1, X2 Î B2, ... Xn Î Bn) = P(X1 Î B1)× P(X2 Î B2)× ... ×P(Xn Î บีน).

ทฤษฎีบท: XV X1, X2, .... Xn เป็นอิสระก็ต่อเมื่อ ณ จุดใด ๆ x = (x1, x2, ..., xn) ความเท่าเทียมกันต่อไปนี้ถือ: F(x1, x2, ..., xn) ) = F(x1) × F (x2) × ... × F (xn) (หรือ f(x1, x2, ..., xn) = f(x1) × f(x2) × ... × f (xn)).

สำหรับเวกเตอร์สุ่มสองมิติ (X, Y) จะมีการแนะนำคุณลักษณะเชิงตัวเลขต่อไปนี้

โมเมนต์เริ่มต้นของคำสั่ง r + s ของเวกเตอร์สุ่ม (X, Y) คือจำนวนจริง nr,s ซึ่งกำหนดโดยสูตร:

nr,s = M =

โมเมนต์เริ่มต้น nr มีอยู่ถ้าอินทิกรัล (ตามลำดับ อนุกรม) ทางด้านขวามือของความเท่าเทียมกันมาบรรจบกันโดยสิ้นเชิง โดยเฉพาะอย่างยิ่ง nr,0 = M คือช่วงเวลาเริ่มต้นที่สอดคล้องกันขององค์ประกอบ X เวกเตอร์ที่มีพิกัดที่ไม่สุ่ม (mX, mY) = (n1,0, n0,1) เรียกว่าความคาดหวังของเวกเตอร์สุ่ม (X , Y) หรือศูนย์กระจาย

โมเมนต์ศูนย์กลางของคำสั่ง r + s ของเวกเตอร์สุ่ม (X, Y) คือจำนวนจริง mr,s ที่กำหนดโดยสูตร

mr,s = M[(X-mX)r (Y-mY)s] =

โมเมนต์ศูนย์กลาง mr มีอยู่ถ้าอินทิกรัล (ตามลำดับ อนุกรม) ทางด้านขวามือของความเท่าเทียมกันมาบรรจบกันโดยสิ้นเชิง เวกเตอร์ที่มีพิกัดไม่สุ่ม (DX, DY) = (m2,0, m0,2) เรียกว่าความแปรปรวนของเวกเตอร์สุ่ม

โมเมนต์ศูนย์กลาง m1,1 เรียกว่าโมเมนต์สหสัมพันธ์ (ความแปรปรวนร่วม): KXY = M = M[(X-mX)×(Y-mY)] = M-mX mY

สัมประสิทธิ์สหสัมพันธ์ของส่วนประกอบ X และ Y แบบสุ่มสองตัวของเวกเตอร์สุ่มคือความแปรปรวนร่วมที่ทำให้เป็นมาตรฐาน

rXY = KXY/(sXsY)

สมบัติของความแปรปรวนร่วม (และสัมประสิทธิ์สหสัมพันธ์)

แนวคิดของตัวแปรสุ่ม ตัวแปรสุ่มแบบไม่ต่อเนื่องและต่อเนื่อง ฟังก์ชันการกระจายความน่าจะเป็นและคุณสมบัติของมัน ความหนาแน่นของการกระจายความน่าจะเป็นและคุณสมบัติของมัน ลักษณะเชิงตัวเลขของตัวแปรสุ่ม: การคาดหมายทางคณิตศาสตร์ การกระจายและคุณสมบัติของตัวแปร ส่วนเบี่ยงเบนมาตรฐาน โหมดและค่ามัธยฐาน ช่วงเวลาเริ่มต้นและศูนย์กลางความไม่สมดุลและความโด่ง ลักษณะเชิงตัวเลขของค่าเฉลี่ยเลขคณิตของตัวแปรสุ่มอิสระ n ตัว

แนวคิดของตัวแปรสุ่ม

สุ่มมีการเรียกปริมาณซึ่งเป็นผลมาจากการทดสอบใช้ค่าที่เป็นไปได้อย่างใดอย่างหนึ่ง (แต่เพียงค่าเดียวเท่านั้น) ไม่ทราบล่วงหน้าเปลี่ยนจากการทดสอบเป็นการทดสอบและขึ้นอยู่กับสถานการณ์สุ่ม ซึ่งแตกต่างจากเหตุการณ์สุ่มซึ่งเป็นคุณลักษณะเชิงคุณภาพของผลการทดสอบแบบสุ่ม ตัวแปรสุ่มจะกำหนดลักษณะเฉพาะของผลการทดสอบในเชิงปริมาณ ตัวอย่างของตัวแปรสุ่มคือขนาดของชิ้นงาน ข้อผิดพลาดในผลลัพธ์ของการวัดค่าพารามิเตอร์ใดๆ ของผลิตภัณฑ์หรือสภาพแวดล้อม ในบรรดาตัวแปรสุ่มที่พบในการปฏิบัติ แบ่งได้สองประเภทหลัก: แบบไม่ต่อเนื่องและต่อเนื่อง

ไม่ต่อเนื่องเป็นตัวแปรสุ่มที่ใช้ชุดค่าที่นับได้มีจำกัดหรือนับได้ไม่สิ้นสุด ตัวอย่างเช่น: ความถี่ของการยิงสามนัด; จำนวนสินค้าที่มีข้อบกพร่องในชุด n ชิ้น จำนวนการโทรเข้าแลกโทรศัพท์ระหว่างวัน จำนวนความล้มเหลวขององค์ประกอบอุปกรณ์ในช่วงระยะเวลาหนึ่งเมื่อทำการทดสอบเพื่อความน่าเชื่อถือ จำนวนนัดก่อนยิงเป้าครั้งแรก ฯลฯ

ต่อเนื่องเรียกว่าตัวแปรสุ่มที่สามารถรับค่าใดๆ จากช่วงจำกัดหรือช่วงอนันต์ได้ เห็นได้ชัดว่าจำนวนค่าที่เป็นไปได้ของตัวแปรสุ่มแบบต่อเนื่องนั้นไม่มีที่สิ้นสุด ตัวอย่างเช่น ข้อผิดพลาดในการวัดระยะของเรดาร์ เวลาทำงานของชิป; ความผิดพลาดในการผลิตชิ้นส่วน ความเข้มข้นของเกลือในน้ำทะเล ฯลฯ

ตัวแปรสุ่มมักจะแสดงด้วยตัวอักษร X, Y ฯลฯ และค่าที่เป็นไปได้คือ x, y เป็นต้น หากต้องการระบุตัวแปรสุ่ม การแสดงค่าที่เป็นไปได้ทั้งหมดนั้นไม่เพียงพอ นอกจากนี้ยังจำเป็นต้องทราบด้วยว่าค่าหนึ่งหรือค่าอื่นอาจปรากฏขึ้นจากการทดสอบภายใต้เงื่อนไขเดียวกันบ่อยเพียงใดนั่นคือ จำเป็นต้องกำหนดความน่าจะเป็นของการเกิดขึ้น ชุดของค่าที่เป็นไปได้ทั้งหมดของตัวแปรสุ่มและความน่าจะเป็นที่สอดคล้องกันถือเป็นการกระจายของตัวแปรสุ่ม

กฎการกระจายตัวของตัวแปรสุ่ม

กฎหมายการจัดจำหน่ายตัวแปรสุ่มคือความสอดคล้องระหว่างค่าที่เป็นไปได้ของตัวแปรสุ่มและความน่าจะเป็นที่สอดคล้องกัน มีการกล่าวกันว่าตัวแปรสุ่มเป็นไปตามกฎหมายการแจกแจงที่กำหนด ตัวแปรสุ่มสองตัวเรียกว่า เป็นอิสระหากกฎการกระจายของหนึ่งในนั้นไม่ได้ขึ้นอยู่กับค่าที่เป็นไปได้ ค่าอื่นที่ได้รับ มิฉะนั้นจะเรียกตัวแปรสุ่ม ขึ้นอยู่กับ. ตัวแปรสุ่มหลายตัวเรียกว่า เป็นอิสระซึ่งกันและกันหากกฎการจัดจำหน่ายของจำนวนใด ๆ ไม่ได้ขึ้นอยู่กับค่าที่เป็นไปได้ของปริมาณอื่น ๆ

กฎการแจกแจงของตัวแปรสุ่มสามารถกำหนดได้ในรูปแบบของตาราง ฟังก์ชันการกระจาย หรือความหนาแน่นของการแจกแจง ตารางที่มีค่าที่เป็นไปได้ของตัวแปรสุ่มและความน่าจะเป็นที่สอดคล้องกันเป็นรูปแบบที่ง่ายที่สุดในการระบุกฎการกระจายของตัวแปรสุ่ม

\begin(array)(|c|c|c|c|c|c|c|)\hline(X)&x_1&x_2&x_3&\cdots&x_(n-1)&x_n\\\hline(P)&p_1&p_2&p_3&\cdots&p_(n-1) )&p_n\\\hline\end(อาร์เรย์)

ข้อกำหนดแบบตารางของกฎหมายการแจกจ่ายสามารถใช้ได้เฉพาะกับตัวแปรสุ่มแบบไม่ต่อเนื่องที่มีค่าที่เป็นไปได้จำนวนจำกัด รูปแบบตารางของการระบุกฎของตัวแปรสุ่มเรียกอีกอย่างว่าชุดการแจกแจง

เพื่อความชัดเจน ชุดการแจกจ่ายจะแสดงเป็นภาพกราฟิก ในการแสดงกราฟิกในระบบพิกัดสี่เหลี่ยม ค่าที่เป็นไปได้ทั้งหมดของตัวแปรสุ่มจะถูกพล็อตตามแกน abscissa และความน่าจะเป็นที่สอดคล้องกันจะถูกพล็อตตามแกนพิกัด จุด (x_i,p_i) ที่เชื่อมต่อกันด้วยส่วนของเส้นตรงเรียกว่า รูปหลายเหลี่ยมการกระจาย(รูปที่ 5). ควรจำไว้ว่าการเชื่อมต่อของจุด (x_i,p_i) ดำเนินการเพื่อความชัดเจนเท่านั้นเนื่องจากในช่วงเวลาระหว่าง x_1 และ x_2 , x_2 และ x_3 เป็นต้น ไม่มีค่าที่ตัวแปรสุ่ม X สามารถ ดังนั้นความน่าจะเป็นของการเกิดขึ้นในช่วงเวลาเหล่านี้จึงเป็นศูนย์

รูปหลายเหลี่ยมการกระจาย เช่นเดียวกับอนุกรมการแจกแจง เป็นหนึ่งในรูปแบบการระบุกฎการแจกแจงของตัวแปรสุ่มแบบไม่ต่อเนื่อง พวกมันอาจมีรูปร่างต่างกัน แต่พวกมันทั้งหมดเหมือนกัน ทรัพย์สินส่วนกลาง: ผลรวมของพิกัดของจุดยอดของรูปหลายเหลี่ยมการกระจาย ซึ่งเป็นผลรวมของความน่าจะเป็นของค่าที่เป็นไปได้ทั้งหมดของตัวแปรสุ่ม มีค่าเท่ากับหนึ่งเสมอ คุณสมบัตินี้เกิดขึ้นจากข้อเท็จจริงที่ว่าค่าที่เป็นไปได้ทั้งหมดของตัวแปรสุ่ม X สร้างกลุ่มเหตุการณ์ที่เข้ากันไม่ได้ทั้งหมด ซึ่งผลรวมของความน่าจะเป็นเท่ากับหนึ่ง

ฟังก์ชันการกระจายความน่าจะเป็นและคุณสมบัติของมัน

ฟังก์ชันการกระจายเป็นรูปแบบทั่วไปที่สุดของการกำหนดกฎหมายการจำหน่าย ใช้เพื่อระบุตัวแปรสุ่มทั้งแบบไม่ต่อเนื่องและต่อเนื่อง ปกติจะใช้แทน F(x) ฟังก์ชันการกระจายกำหนดความน่าจะเป็นที่ตัวแปรสุ่ม X รับค่าน้อยกว่าจำนวนจริงคงที่ x เช่น F(x)=P\(X ฟังก์ชันการกระจายอินทิกรัล

การตีความทางเรขาคณิตของฟังก์ชันการกระจายนั้นง่ายมาก หากตัวแปรสุ่มถือเป็นจุดสุ่ม X ของแกน Ox (รูปที่ 6) ซึ่งจากการทดสอบสามารถรับตำแหน่งใดตำแหน่งหนึ่งบนแกนได้ ดังนั้น ฟังก์ชันการกระจาย F(x) คือ ความน่าจะเป็นที่จุดสุ่ม X จากการทดสอบจะตกไปที่จุดซ้าย x .

สำหรับตัวแปรสุ่มแบบไม่ต่อเนื่อง X ที่รับค่าได้ ฟังก์ชันการแจกแจงจะมีรูปแบบ

F(x)=\sum\limits_(x_i .)
โดยที่ความไม่เท่าเทียมกัน x_i

ตัวแปรสุ่มแบบต่อเนื่องมีฟังก์ชันการแจกแจงแบบต่อเนื่อง กราฟของฟังก์ชันนี้มีรูปแบบของเส้นโค้งเรียบ (รูปที่ 8)

พิจารณาคุณสมบัติทั่วไปของฟังก์ชันการกระจาย

คุณสมบัติ 1 ฟังก์ชันการแจกจ่ายไม่เป็นค่าลบ ฟังก์ชันอยู่ระหว่างศูนย์ถึงหนึ่ง:

0\leqslant(F(x))\leqslant1

ความถูกต้องของคุณสมบัตินี้ตามมาจากข้อเท็จจริงที่ว่าฟังก์ชันการกระจาย F(x) ถูกกำหนดให้เป็นความน่าจะเป็นของเหตุการณ์สุ่มที่ X

คุณสมบัติ 2 ความน่าจะเป็นของตัวแปรสุ่มที่ตกอยู่ในช่วง [\alpha;\beta) เท่ากับความแตกต่างระหว่างค่าของฟังก์ชันการกระจายที่ส่วนท้ายของช่วงเวลานี้ กล่าวคือ

P\(\alpha\leqslant(X)<\beta\}=F(\beta)-F(\alpha)

ตามความน่าจะเป็นของค่าเดียวของตัวแปรสุ่มต่อเนื่องเป็นศูนย์

คุณสมบัติ 3 ฟังก์ชันการกระจายของตัวแปรสุ่มเป็นฟังก์ชันที่ไม่ลดลง กล่าวคือ F(\beta)\geqslant(F(\alpha)).

คุณสมบัติ 4 ที่ลบอนันต์ ฟังก์ชันการแจกแจงจะเท่ากับศูนย์ และที่อนันต์บวก จะเท่ากับหนึ่ง นั่นคือ \lim_(x\to-\infty)F(x)=0และ \lim_(x\to+\infty)F(x)=1.

ตัวอย่างที่ 1 ฟังก์ชันการกระจายของตัวแปรสุ่มแบบต่อเนื่องถูกกำหนดโดยนิพจน์

F(x)=\begin(กรณี)0,&x\leqslant1\\a(x-1)^2,&1 0\end(กรณี)

ค้นหาสัมประสิทธิ์ a และพล็อต F(x) กำหนดความน่าจะเป็นที่ตัวแปรสุ่ม X จากการทดลองจะใช้ค่าในช่วงเวลา

วิธีการแก้. เนื่องจากฟังก์ชันการกระจายของตัวแปรสุ่มต่อเนื่อง X นั้นต่อเนื่องกัน ดังนั้นสำหรับ x=3 เราจึงได้ a(3-1)^2=1 ดังนั้น a=\frac(1)(4) กราฟของฟังก์ชัน F(x) แสดงในรูปที่ 9.

จากคุณสมบัติที่สองของฟังก์ชันการกระจาย เรามี

P\(1\leqslant(X)<2\}=F(2)-F(1)=\frac{1}{4}.

การกระจายความหนาแน่นของความน่าจะเป็นและคุณสมบัติของมัน

ฟังก์ชันการกระจายของตัวแปรสุ่มแบบต่อเนื่องคือคุณลักษณะความน่าจะเป็น แต่มีข้อเสียคือ เป็นการยากที่จะตัดสินธรรมชาติของการแจกแจงตัวแปรสุ่มในย่านเล็กๆ ของจุดใดจุดหนึ่งของแกนตัวเลข การแสดงภาพธรรมชาติของการแจกแจงของตัวแปรสุ่มต่อเนื่องที่มองเห็นได้ชัดเจนขึ้นนั้นมาจากฟังก์ชันที่เรียกว่าความหนาแน่นของการแจกแจงความน่าจะเป็น หรือฟังก์ชันการกระจายส่วนต่างของตัวแปรสุ่ม

ความหนาแน่นของการกระจาย f(x) เท่ากับอนุพันธ์ของฟังก์ชันการกระจาย F(x) นั่นคือ

F(x)=F"(x).

ความหมายของความหนาแน่นของการกระจาย f(x) คือมันบ่งชี้ว่าตัวแปรสุ่ม X ปรากฏในบริเวณใกล้เคียงของจุด x บ่อยเพียงใดเมื่อทำการทดลองซ้ำ เส้นโค้งที่แสดงความหนาแน่นการกระจาย f(x) ของตัวแปรสุ่มเรียกว่า เส้นโค้งการกระจาย

พิจารณา คุณสมบัติความหนาแน่นของการกระจาย

คุณสมบัติ 1 ความหนาแน่นของการกระจายไม่เป็นลบ กล่าวคือ

F(x)\geqslant0.

คุณสมบัติ 2 ฟังก์ชันการกระจายของตัวแปรสุ่มเท่ากับอินทิกรัลของความหนาแน่นในช่วงเวลาตั้งแต่ -\infty ถึง x นั่นคือ

F(x)=\int\limits_(-\infty)^(x)f(x)\,dx.

คุณสมบัติ 3 ความน่าจะเป็นของตัวแปรสุ่มต่อเนื่อง X ที่กระทบกลุ่ม (\alpha;\beta) เท่ากับอินทิกรัลของความหนาแน่นของการแจกแจงที่นำมาบนส่วนนี้ กล่าวคือ

P\(\alpha\leqslant(X)\leqslant\beta\)=\int\limits_(\alpha)^(\beta)f(x)\,dx.

คุณสมบัติ 4 อินทิกรัลในขีดจำกัดอนันต์ของความหนาแน่นของการแจกแจงเท่ากับหนึ่ง:

\int\limits_(-\infty)^(+\infty)f(x)\,dx=1.

ตัวอย่างที่ 2 ตัวแปรสุ่ม X อยู่ภายใต้กฎการแจกแจงที่มีความหนาแน่น

F(x)=\begin(กรณี)0,&x<0\\a\sin{x},&0\pi\end(กรณี)

หาค่าสัมประสิทธิ์ a; สร้างกราฟความหนาแน่นของการกระจาย ค้นหาความน่าจะเป็นที่จะชนตัวแปรสุ่มในพื้นที่ตั้งแต่ 0 ถึง \frac(\pi)(2) กำหนดฟังก์ชันการกระจายและสร้างกราฟ

\int\limits_(-\infty)^(+\infty)f(x)\,dx=a\int\limits_(0)^(\pi)\sin(x)\,dx=\Bigl.(- a\cos(x))\Bigl|_(0)^(\pi)=2a.

พิจารณาคุณสมบัติ 4 ของความหนาแน่นของการกระจาย เราพบ a=\frac(1)(2) ดังนั้นความหนาแน่นของการกระจายสามารถแสดงได้ดังนี้:

F(x)=\begin(กรณี)0,&x<0\\\dfrac{1}{2}\sin{x},&0\pi\end(กรณี)

พล็อตของความหนาแน่นของการกระจายในรูปที่ 10. โดยคุณสมบัติ 3 เรามี

ป\!\left\(0

เพื่อกำหนดฟังก์ชันการกระจาย เราใช้คุณสมบัติ 2:

F(x)=\frac(1)(2)\int\limits_(0)^(x)\sin(x)\,dx=\Bigl.(\-\frac(1)(2)\cos( x))\Bigl|_(0)^(x)=\frac(1)(2)-\frac(1)(2)\cos(x).

ดังนั้นเราจึงมี

F(x)=\begin(กรณี)0,&x<0\\\dfrac{1}{2}-\dfrac{1}{2}\cos{x},&0\pi\end(กรณี)

กราฟฟังก์ชันการกระจายแสดงในรูปที่ สิบเอ็ด

ลักษณะเชิงตัวเลขของตัวแปรสุ่ม

กฎการแจกจ่ายกำหนดลักษณะตัวแปรสุ่มอย่างสมบูรณ์จากมุมมองที่น่าจะเป็น แต่เมื่อแก้ปัญหาในทางปฏิบัติจำนวนหนึ่ง ไม่จำเป็นต้องรู้ค่าที่เป็นไปได้ทั้งหมดของตัวแปรสุ่มและความน่าจะเป็นที่สอดคล้องกัน แต่สะดวกกว่าที่จะใช้ตัวบ่งชี้เชิงปริมาณ ตัวบ่งชี้ดังกล่าวเรียกว่าตัวเลข ลักษณะของตัวแปรสุ่มปัจจัยหลักคือความคาดหวังทางคณิตศาสตร์ ความแปรปรวน ช่วงเวลาของคำสั่งต่างๆ โหมดและค่ามัธยฐาน

ความคาดหวังทางคณิตศาสตร์บางครั้งเรียกว่าค่ากลางของตัวแปรสุ่ม พิจารณาตัวแปรสุ่มแบบไม่ต่อเนื่อง X รับค่า x_1,x_2,\ldots,x_nด้วยความน่าจะเป็นตามลำดับ p_1,p_2,\ldots,p_nให้เรากำหนดค่าเฉลี่ยเลขคณิตของค่าของตัวแปรสุ่มโดยถ่วงน้ำหนักโดยความน่าจะเป็นที่จะเกิดขึ้น ดังนั้นเราจึงคำนวณค่าเฉลี่ยของตัวแปรสุ่มหรือความคาดหวังทางคณิตศาสตร์ของตัวแปร M(X) :

M(X)=\frac(x_1p_1+x_2p_2+\cdots+x_np_n)(p_1+p_2+\cdots+p_n)=\frac(\sum\limits_(i=1)^(n)x_ip_i)(\sum\limits_( ผม=1)^(n)p_i).

ระบุว่า \sum\limits_(i=1)^(n)p_i=1เราได้รับ

M(X)=\sum\limits_(i=1)^(n)x_ip_i).~~~~~~~(4.1)

ดังนั้น, ความคาดหวังทางคณิตศาสตร์ตัวแปรสุ่มแบบไม่ต่อเนื่องคือผลรวมของผลิตภัณฑ์ของค่าที่เป็นไปได้ทั้งหมดและความน่าจะเป็นที่สอดคล้องกัน

สำหรับตัวแปรสุ่มต่อเนื่อง การคาดหมายทางคณิตศาสตร์

M(X)=\int\limits_(-\infty)^(\infty)xf(x)\,dx.

การคาดการณ์ทางคณิตศาสตร์ของตัวแปรสุ่มอย่างต่อเนื่อง X ค่าที่เป็นไปได้ซึ่งเป็นของกลุ่ม ,

M(X)=\int\limits_(a)^(b)xf(x)\,dx.~~~~~~~(4.2)

การใช้ฟังก์ชันการกระจายความน่าจะเป็น F(x) การคาดหมายทางคณิตศาสตร์ของตัวแปรสุ่มสามารถแสดงได้ดังนี้:

M(X)=\int\limits_(-\infty)^(\infty)x\,d(F(x)).

คุณสมบัติความคาดหวัง

คุณสมบัติ 1 ความคาดหวังทางคณิตศาสตร์ของผลรวมของตัวแปรสุ่มสองตัวเท่ากับผลรวมของความคาดหวังทางคณิตศาสตร์:

M(X+Y)=M(X)+M(Y).

คุณสมบัติ 2 ความคาดหวังทางคณิตศาสตร์ของผลิตภัณฑ์ของตัวแปรสุ่มอิสระสองตัวเท่ากับผลคูณของความคาดหวังทางคณิตศาสตร์:

ม(XY)=ม(X)ม(Y).

คุณสมบัติ 3 การคาดหมายทางคณิตศาสตร์ของค่าคงที่เท่ากับค่าคงที่เอง:

ม(ค)=ค.

คุณสมบัติ 4 ตัวคูณค่าคงที่ของตัวแปรสุ่มสามารถนำออกจากเครื่องหมายคาดหวัง:

M(cX)=cM(X).

คุณสมบัติ 5 ความคาดหวังทางคณิตศาสตร์ของการเบี่ยงเบนของตัวแปรสุ่มจากการคาดหมายทางคณิตศาสตร์เป็นศูนย์:

M(X-M(X))=0.

ตัวอย่างที่ 3 ค้นหาความคาดหวังทางคณิตศาสตร์ของจำนวนสินค้าที่มีข้อบกพร่องในตัวอย่างห้ารายการ ถ้าตัวแปรสุ่ม X (จำนวนสินค้าที่มีข้อบกพร่อง) ถูกกำหนดโดยชุดการแจกจ่าย

\begin(array)(|c|c|c|c|c|c|c|)\hline(X)&0&1&2&3&4&5\\\hline(P)&0,\!2373&0,\!3955&0,\!2637&0,\ !0879&0,\!0146&0,\!0010\\\hline\end(อาร์เรย์)

วิธีการแก้. ตามสูตร (4.1) เราพบว่า

M(X)=0\cdot0,\!2373+1\cdot0,\!3955+2\cdot0,\!2637+3\cdot0,\!0879+4\cdot0,\!0146+5\cdot0,\ !0010 =1,\!25.

โหมด M_0 ของตัวแปรสุ่มแบบไม่ต่อเนื่องค่าที่น่าจะเป็นไปได้มากที่สุดเรียกว่า

โหมด M_0 ของตัวแปรสุ่มต่อเนื่องค่าของมันเรียกว่าซึ่งสอดคล้องกับค่าที่ใหญ่ที่สุดของความหนาแน่นของการกระจาย ในเชิงเรขาคณิต โหมดนี้ถูกตีความว่าเป็น abscissa ของจุดสูงสุดของเส้นโค้งการกระจายสูงสุดทั่วโลก (รูปที่ 12)

ค่ามัธยฐาน M_e ของตัวแปรสุ่มคุณค่าของมันเรียกว่าความเท่าเทียมกัน

ป\(X ผม\).

จากมุมมองทางเรขาคณิต ค่ามัธยฐานคือ abscissa ของจุดที่พื้นที่ของรูปล้อมรอบด้วยเส้นโค้งการกระจายความน่าจะเป็นและแกน abscissa ถูกแบ่งครึ่ง (รูปที่ 12) เนื่องจากพื้นที่ทั้งหมดที่ล้อมรอบด้วยเส้นโค้งการกระจายและแกน x เท่ากับหนึ่ง ฟังก์ชันการกระจายที่จุดที่ตรงกับค่ามัธยฐานคือ 0.5 กล่าวคือ

F(M_e)=P\(X

ด้วยความช่วยเหลือของความแปรปรวนและค่าเบี่ยงเบนมาตรฐาน เราสามารถตัดสินการกระจายตัวของตัวแปรสุ่มรอบการคาดหมายทางคณิตศาสตร์ ในการวัดการกระจายตัวของตัวแปรสุ่ม จะใช้การคาดหมายทางคณิตศาสตร์ของค่าเบี่ยงเบนกำลังสองของตัวแปรสุ่มจากการคาดหมายทางคณิตศาสตร์ ซึ่งเรียกว่า ความแปรปรวนตัวแปรสุ่ม X และแสดงว่า D[X] :

D[X]=M((X-M(X))^2).

สำหรับตัวแปรสุ่มแบบไม่ต่อเนื่อง ความแปรปรวนจะเท่ากับผลรวมของผลิตภัณฑ์ของการเบี่ยงเบนกำลังสองของค่าของตัวแปรสุ่มจากการคาดหมายทางคณิตศาสตร์โดยความน่าจะเป็นที่สอดคล้องกัน:

D[X]=\sum\limits_(i=1)^(n)(x_i-M(X))^2p_i.

สำหรับตัวแปรสุ่มอย่างต่อเนื่องซึ่งกฎการแจกแจงได้รับจากความหนาแน่นของการแจกแจงความน่าจะเป็น f(x) ความแปรปรวน

D[X]=\int\limits_(-\infty)^(+\infty)(x-M(X))^2f(x)\,dx.

มิติของความแปรปรวนเท่ากับกำลังสองของมิติของตัวแปรสุ่ม ดังนั้นจึงไม่สามารถตีความในเชิงเรขาคณิตได้ ข้อบกพร่องเหล่านี้ไม่มีค่าเบี่ยงเบนมาตรฐานของตัวแปรสุ่มซึ่งคำนวณโดยสูตร

\sigma=\sqrt(D[X])

คุณสมบัติของการกระจายตัวของตัวแปรสุ่ม

คุณสมบัติ 1 ความแปรปรวนของผลรวมของตัวแปรสุ่มอิสระสองตัวเท่ากับผลรวมของความแปรปรวนของตัวแปรเหล่านี้:

D=D[X]+D[Y].

คุณสมบัติ 2 ความแปรปรวนของตัวแปรสุ่มเท่ากับความแตกต่างระหว่างความคาดหวังทางคณิตศาสตร์ของกำลังสองของตัวแปรสุ่ม X และกำลังสองของการคาดหมายทางคณิตศาสตร์:

D[X]=M(X^2)-(M(X))^2.~~~~~~~(4.3)

คุณสมบัติ 3 การกระจายของค่าคงที่เป็นศูนย์:

D[c]=0.

คุณสมบัติ 4 ปัจจัยคงที่ของตัวแปรสุ่มสามารถนำออกจากเครื่องหมายความแปรปรวนได้โดยการยกกำลังสองก่อน:

D=c^2D[X].

คุณสมบัติ 5. ความแปรปรวนของผลิตภัณฑ์ของตัวแปรสุ่มอิสระสองตัว X และ Y ถูกกำหนดโดยสูตร

D=D[X]D[Y]+(M(X))^2D[Y]+(M(X))^2D[X].

ตัวอย่างที่ 4 คำนวณความแปรปรวนของจำนวนผลิตภัณฑ์ที่บกพร่องสำหรับการกระจายตัวอย่างที่ 3

วิธีการแก้. โดยนิยามของความแปรปรวน

ลักษณะทั่วไปของลักษณะเชิงตัวเลขหลักของตัวแปรสุ่มคือแนวคิดของช่วงเวลาของตัวแปรสุ่ม

ช่วงเวลาเริ่มต้นของคำสั่ง qthตัวแปรสุ่มเรียกว่าการคาดหมายทางคณิตศาสตร์ของค่า X^q:

โมเมนต์เริ่มต้นของลำดับที่หนึ่งคือการคาดหมายทางคณิตศาสตร์ และโมเมนต์ศูนย์กลางของลำดับที่สองคือความแปรปรวนของตัวแปรสุ่ม

โมเมนต์ศูนย์กลางที่ทำให้เป็นมาตรฐานของลำดับที่สามทำหน้าที่เป็นลักษณะของความเบ้หรือความไม่สมมาตรของการกระจาย ( ปัจจัยไม่สมมาตร):

A_s=\frac(\mu_(()_3))(\sigma^3).

โมเมนต์ศูนย์กลางที่ทำให้เป็นมาตรฐานของลำดับที่สี่ทำหน้าที่เป็นลักษณะของการกระจายแบบยอดแหลมหรือแบบแบน ( ส่วนเกิน):

E=\frac(\mu_(()_4))(\sigma^4)-3.

ตัวอย่างที่ 5 ตัวแปรสุ่ม X ถูกกำหนดโดยการแจกแจงความหนาแน่นของความน่าจะเป็น

F(x)=\begin(กรณี)0,&x<0;\\ax^2,&02.\end(กรณี)

ค้นหาสัมประสิทธิ์ a , ความคาดหวังทางคณิตศาสตร์, ความแปรปรวน, ความเบ้และความโด่ง

วิธีการแก้. พื้นที่ที่ล้อมรอบด้วยเส้นโค้งการกระจายมีค่าเท่ากับ

\int\limits_(0)^(2)f(x)\,dx=a\int\limits_(0)^(2)x^2\,dx=\left.(a\,\frac(x^ 3)(3))\right|_(0)^(2)=\frac(8)(3)\,ก.

เนื่องจากพื้นที่นี้ควรเท่ากับหนึ่ง เราจะพบ a=\frac(3)(8) โดยใช้สูตร (4.2) เราพบการคาดหมายทางคณิตศาสตร์:

M(X)=\int\limits_(0)^(2)xf(x)\,dx=\frac(3)(8)\int\limits_(0)^(2)x^3\,dx= \left.(\frac(3)(8)\cdot\frac(x^4)(4))\right|_(0)^(2)=1,\!5.

การกระจายตัวถูกกำหนดโดยสูตร (4.3) ในการทำเช่นนี้ ก่อนอื่น ให้หาการคาดหมายทางคณิตศาสตร์ของกำลังสองของตัวแปรสุ่ม:

M(X^2)=\int\limits_(0)^(2)x^2f(x)\,dx=\frac(3)(8)\int\limits_(0)^(2)x^4 \,dx=\left.(\frac(3)(8)\cdot\frac(x^5)(5))\right|_(0)^(2)=2,\!4.

ทางนี้,

\begin(aligned)D(X)&=M(X^2)-(M(X))^2=2,\!4-(1,\!5)^2=0,\!15;\ \ \sigma(X)&=\sqrt(D(X))=\sqrt(0,\!15)\approx0,\!3873.\end(aligned)

โดยใช้ช่วงเวลาเริ่มต้น เราคำนวณช่วงเวลาศูนย์กลางของลำดับที่สามและสี่:

\begin(aligned)\nu_1&=M(X)=1,\!5;\quad\nu_2=M(X^2)=2,\!4.\\ \nu_3&=M(X^3)=\ int\limits_0^2(x^3f(x)\,dx)=\frac(3)(8)\int\limits_0^2(x^5\,dx)=\left.(\frac(3)( 8)\cdot\frac(x^6)(6))\right|_0^2=4;\\ \nu_4&=M(X^4)=\int\limits_0^2(x^4f(x)\ ,dx)=\frac(3)(8)\int\limits_0^2(x^6\,dx)=\left.(\frac(3)(8)\cdot\frac(x^7)(7 ))\right|_0^2\ประมาณ6,\!8571;\\ \mu_3&=\nu_3-3\nu_1\nu_2+2\nu_1^3=4-3\cdot1,\!5\cdot2,\!4 +2\cdot(1,\!5)^3=-0,\!05.\\ \mu_4&=\nu_4-4\nu_1\nu_3+6\nu_1^2\nu_2-3\nu_1^4=\ \&=6,\!8571-4\cdot1,\!5\cdot4+6\cdot(1,\!5)^2\cdot2,\!4-3\cdot(1,\!5)^4 =0,\!0696.\\ A_s&=\frac(\mu_3)(\sigma^3)=-\frac(0,\!05)((0,\!3873)^3)=-0,\ !86.\\ E&=\frac(\mu_4)(\sigma^4)-3=\frac(0,\!0696)((0,\!3873)^4)-3=-0,\! 093.\end(จัดตำแหน่ง)

ลักษณะเชิงตัวเลขของค่าเฉลี่ยเลขคณิตของตัวแปรสุ่มอิสระ n ตัว

อนุญาต x_1,x_2,\ldots,x_n- ค่าของตัวแปรสุ่ม X ที่ได้จากการทดลองอิสระ n ครั้ง ความคาดหวังทางคณิตศาสตร์ของตัวแปรสุ่มมีค่าเท่ากับ M(X) และความแปรปรวนของมันคือ D[X] ค่าเหล่านี้ถือได้ว่าเป็นตัวแปรสุ่มอิสระ X_1,X_2,\ldots,X_nด้วยความคาดหวังและความแปรปรวนทางคณิตศาสตร์ที่เหมือนกัน:

ม(X_i)=ม(X); \quad D=D[X],~~i=1,2,\ldots,n.

ค่าเฉลี่ยเลขคณิตของตัวแปรสุ่มเหล่านี้

\overline(X)=\sum\limits_(i=1)^(n)\frac(X_i)(n)

โดยใช้คุณสมบัติของการคาดหมายทางคณิตศาสตร์และการกระจายตัวของตัวแปรสุ่ม เราสามารถเขียนได้ดังนี้

\begin(aligned)M(\overline(X))&=M\!\left(\frac(1)(n)\sum\limits_(i=1)^(n)X_i\right)=\frac( 1)(n)\sum\limits_(i=1)^(n)M(X_i)=M(X).~~~~~~~(4.4)\\ D[\overline(X)]&= D\!\left[\frac(1)(n)\sum\limits_(i=1)^(n)X_i\right]=\frac(1)(n^2)\sum\limits_(i=1 )^(n)D=\frac(D[X])(n).~~~~~~~(4.5)\end(aligned)


ข้ามไปยังส่วนถัดไป
ตัวแปรสุ่มหลายตัวแปร
Javascript ถูกปิดใช้งานในเบราว์เซอร์ของคุณ
ต้องเปิดใช้งานการควบคุม ActiveX เพื่อทำการคำนวณ!