|
本帖最后由 gzeratsg 于 2010-3-26 21:26 编辑
某日,在家觉得没事干,于是就专门来到这里,守候146分钟,拍下了31路车不全集。是的,不全集。
二、候车时间小分析
在第三次拍摄的时候,从15.29hr到17.55hr,共146分钟里,共看见39车次,33辆车,平均候车时间为146 ÷ 38 = 3.84 (3 s.f.)分钟。
39车次里看见33辆车,即表示有6辆车被看至少一次。事实是有6辆车被看见两次。他们两次被看见的间隔时间从86到138分钟不等,其中有部分车辆曾运行区间短线车。
首先是部分主要统计数据:
来自R:
int
Min. : 0.000
1st Qu.: 1.000
Median : 3.000
Mean : 3.842
3rd Qu.: 6.750
Max. :11.000
来自SAS:
注解:
平均等候时间:3.84分钟。
标准差:3.35分钟。
候车时间的中位数(median)为3分钟,即有一半的候车时间小于或等于3分钟。
Q3 = 6.75:75%的候车时间小于6分45秒。
下图是候车时间的统计直方图(SAS绘图)。
由上图可以看出,候车时间峰值(mode)为2分钟,其次是0分钟。图中曲线为假定正态分布。很明显,候车时间并不跟随正态分布。下面的多个检测结果也证实这一结果。
下图是候车时间的boxplot(R绘图)。
由上图可以看出,候车时间系skew to the right的。
假设检验:
假设检验1:H_0:平均等候时间为3分钟vs H_1:平均等候时间不是3分钟。
检验结果1:不拒绝H_0。
假设检验2:H_0:平均等候时间为3分钟vs H_1:平均等候时间大于3分钟。
检验结果2:不拒绝H_0。
假设检验3:H_0:平均等候时间为3分钟vs H_1:平均等候时间下于3分钟。
检验结果3:不拒绝H_0。
注:在实际生活中,候车时间应该呈连续型分布(continuous distribution),但为了简便,在这里,我们把它离散化(discretise),将它看作离散型分布(discrete distribution)分析。上面提到的R是一个免费的统计软件。
Remark: In fact, the waiting time interval is a continuous distribution. For simplicity sake, it is discretised and treated as a discrete distribution for analysis. The R mentioned before is a free statistical analysis software.
时间序列分析
现象:
Raw Scatter Plot:
SAS ACF and PACF plots:
R ACF and PACF plots:
从ACF和PACF图可以看出,等候时间的ACF和PACF均不显著。
Ljung Box Test:
The Ljung Box Test shows that there is no serial dependence among the waiting time interval. |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?注册
x
|