收尾工作

  1. 完成通路逻辑

    通路逻辑

    1. 大屏上Dock内,点击悉之app启动浏览器:翼鸥
    2. 开屏老师打招呼、左侧二维码等待学生传图【确认UI】
    3. 学生扫码,支持拍照传图、从相册中传图,只能传一张图【确认UI】
      1. 英语语文题干太长没法传
      2. 跨页题没法传
    4. 讲解过程持续优化
      1. 第一句话和结尾里面:同学们指称删去 ✓
      2. 页面滚动位置逻辑 有较大问题 可能是页面滚动缓存根据设备有问题 ✓
      3. 动画动作切换有瞬移 比较僵硬 ✓
    5. 结束讲解后,界面立即推荐扫码讲新题【确认UI】
      1. 问答带语音讲解部分 ✕
      2. 继续下一道题的讲解
  2. 翼鸥部分 2-3周时间

    1. 账号体系 ✕
    2. 订阅通路 ✕
  3. 财务处理

    1. 执行起来是0.3元/次后台解题调用 + 0.7元/次多模态智能讲解调用(普通模式),支持30个并发;精讲模式1.5元/次,生成时间更长,引导性更强些
    2. 现在提付尾款,或者先支付90%,完全结束后付最后的10%

二期待解决问题

  1. 肖何:核心问题还是没想清楚哪些应该最主要地呈现,比如右下角可以改成tab格式,把实时字幕和问答做成二选一的tab
    1. Tab 字幕:这样让人和他说的话在一起,时间戳
    2. Tab 问答:对话逻辑白底
  2. 交互过程中目前有需要学生行走的距离
    1. 手机页面是否可控制点击
      1. 手机页面上可以先出现解析生成
      2. 可通过一个移动端的遥控器来解决
      3. 讲解结束后有一个入口,无需扫码即可持续提交
    2. 语音常开
    3. 语音时常监听—搭配拒识模型(只和上下文相关的进行识别)
  3. 底部讲解 和 主体内容 和 字幕滚动显示(看不出来 电影字幕放在中间 或 逐字实现) ✕
  4. 问答过程
    1. 问答带语音讲解
    2. 激励动画效果 参考Joyschooler
  5. 讲解口型全对应
  6. 让手势和整体讲解的内容深层次、精准的对应。
    1. 比如列出一、二、三点的时候,手势也能对应比划一根、两根、三根手指,再比如位于肚脐高度的右手握住左手的几根手指来表示计数;
    2. 比如讨论某种范围增大(中国—全球、短期—中期)的时候,姿势的幅度相应增大;
    3. 比如讨论正反打逻辑的问题时,姿势的方向相应镜像;
    4. 比如讨论他人和自我的关系时,手势从向外推转化为向内搂;
    5. 比如讨论惊奇的科学事实的时候,双手掌心前张做爆炸状,等等
  7. 根据讲解的内容,让教师的表情更加丰富有层次感,而非一直保持微笑。
    1. 比如强调严肃的内容题材的时候,应该有皱眉以示警觉;
    2. 成功解题或着关键步骤展示时,应该有喜悦和充满好奇感的表情,等等
  8. 增加更多促进学生主动交互的手势与动作
    1. 点赞
    2. 请学生提问
  9. 在Q&A互动过程中,提升对学生自主学习的支持
    1. 能够有效地引导进一步思考,向学生发问、反问
    2. 给学生思考的时间,合理停顿,直到学生给回复
    3. 能够找到学生问题的具体步骤,向前回滚到对应板书,再开始Q&A

ClassIn对拍搜的判断

  1. 我们认为,无论是平板,还是手机都不合适讲题,他们适合的是看答案、抄题

  2. 大屏未来必然会是讲题的核心交互形态,因为听讲更舒服、屏幕面积更大能展示复杂长公式;

  3. 随着大模型推理 inference 能力大幅加强(GPT o1),K-12 解题 App 未来会烂大街,成为所有与知识技能传授相关的 edtech 产品的基础级能力;

    在这个前提下,解题app的核心竞争力就是最符合用户听讲习惯的交互和界面;