1. 某搜索引擎网站一天的访问日志数据如图a所示,现要从中提取出访问网站次数最多的IP。由于IP日志文件数据量非常大,我们可以把IP日志数据分别存储到多个小文件中,分别统计出每个小文件中出现次数最多的IP地址及次数,再对各个小文件中的数据进行汇总。统计的结果如图b所示。

图 a

图 b

(1) 上述处理大数据的方法,采用的是 思想。
(2) 统计小文件中出现次数最多的IP地址的Python代码如下,在划线出补充合适的代码,实现统计功能。

def showmax(ips):                #统计出现次数最多的 IP 地址和出现次数

dic={}

maxn=0

for i in range(len(ips)):

  if ips[i] in dic:

    dic[ips[i]]+=1

    if :

      maxn=dic[ips[i]]

      maxIp=ips[i]

    else:

        

    return maxIp,maxn

    with open("temp.log"," r ") as ips=[] f:     #读取小文件temp.log中的IP地址

    for line in f:

      ip=line.split()[0]

      ips.append(ip)     #将IP地址逐行追加到列表ips中

            #调用showmax函数

Prin t("出现次数最多的 IP 是: ",a[0],"  出现次数为: ",a[1])

【考点】
分支结构语句及程序实现; 循环结构语句及程序实现; 大数据处理的基本思路;
【答案】

您现在未登录,无法查看试题答案与解析。 登录
综合题 普通
能力提升
换一批
2. 社团成员依据前期收集并整理后的数据,分析并统计食堂各菜品间的关联次数(关联次数指的是不同菜品同时出现在同一订单内的次数),编写Python程序实现:输入菜品名称,输出与其关联次数排名前三(不考虑并列情况)的菜品名称。提出合理的套餐搭配建议。程序运行结果如1图所示。

1 图

(1) 如2图所示,“序号”列中1~12为4位学生的订单信息,其中与“糖醋排骨”关联次数最多的菜品名称是,关联次数是

2 图

(2) 实现上述功能的部分Python程序如下,请在划线处填写合适的代码。

import pandas as pd

df=pd.read_excel ("数据集 A.xlsx")

cp=["小炒时蔬","红烧牛肉","黄焖鸡","红烧肉","粉蒸肉","梅菜扣肉","糖醋排骨 ","烧圆子","小炒肉","水煮肉片","香菇炒肉","鱼香肉丝","烤鸭","香酥鸭","烧 带鱼","炸小鱼","大锅菜","番茄鸡蛋","麻婆豆腐","凉拌黄瓜"]

cpdic={"小炒时蔬":0,"红烧牛肉":1,"黄焖鸡":2,"红烧肉":3,"粉蒸肉":4,"梅菜扣 肉":5,"糖醋排骨":6,"烧圆子":7,"小炒肉":8,"水煮肉片":9,"香菇炒肉":10,"鱼香 肉丝":11,"烤鸭":12,"香酥鸭":13,"烧带鱼":14,"炸小鱼":15,"大锅菜":16,"番茄 鸡蛋":17,"麻婆豆腐":18,"凉拌黄瓜":19}

a=[]

for i in df.values:

    # 列表 a 分别存储订单编号、菜品 id、菜品名称

    a.append([i[2],i[4],i[5]])

n,ncp=len(a),len(cp)

num=[0]*ncp

j=0

cpmc=input("请输入菜品:")

key=cpdic[cpmc]         # 通过菜品名称获取菜品 id

while j<n:

    if j==0 or a[j-1][0]!=a[j][0]:

        start=j

    if a[j][1]==key:

        while a[j][0]==a[start][0]:

            if start!=j:

                num[ ]+=1

            start+=1

            if start==n:

                break

              # 改错

    j+=1

for i in range(3):    # 输出三个套餐搭配建议

    for j in range(ncp-1,i,-1):

        if  :

            num[j-1],num[j]=num[j],num[j-1]

            cp[j-1],cp[j]=cp[j],cp[j-1]

print("建议套餐中包含",cpmc,"与",cp[i],",两个菜品关联次数为",num[i])

(3) 程序中加框处代码有错,请改正。
综合题 普通