goldengrape @goldengrape@mathstodon.xyz Profile picture
躲在世界的外面,愉快地张望,
Jun 10, 2023 6 tweets 1 min read
很猛啊!

再配合两个浏览器插件:
KeepChatGPT
github.com/xcanwin/KeepCh…
ChatGPT Notifier
chrome.google.com/webstore/detai…

前者可以使一次输出保持很久,直到AI agent停下来询问,
后者可以在停下来的时候响铃。所以可以去刷剧玩游戏,听见铃响写"继续"。
另,学术类推荐ScholarAI+Scholarly 我去!
这是个什么神仙插件,这个AI agent插件还自带了一个Noteable插件,形成了一个外部存储!
AI agent+ScholarAI基本就够了,它还真的给我写了篇综述,而且还算不错的。
May 17, 2023 5 tweets 1 min read
ChatGPT插件推荐
Wolfram,ScholarAI,AskYourPDF,WebPilot,
排名分先后。 Wolfram算力强大,写好不易,可要求ChatGPT来写,并且给出测试集,不通过测试集不准停。能够写出不错的代码,然后打开细节复制代码,放进wolframcloud里保存,很方便。
比如:
在世界地图上用蓝色标记出列表中的国家{中国,日本,韩国,美国},再用绿色标记其余国家中GDP前20的国家
May 16, 2023 5 tweets 1 min read
好了,无比中二的“军事联盟”上线了:
advisors-alliance.streamlit.app
我们邀请到了
荀彧,周瑜,徐庶,司马懿,鲁肃,诸葛亮
共同为主公您排忧解难。 Image 此练习的目的在于熟悉langchain中的memory设定,
注意当prompt中有多个输入时,应当在memory中指定input_key,否则报错。
对于同一个问题多角色的连续回答,应当临时屏蔽memory,以免答案进入“回声”状态收敛于单一答案。
memory的设定需要个体化。
代码参考:
github.com/goldengrape/Ad…
May 15, 2023 4 tweets 1 min read
一个简单的军师联盟demo
gist.github.com/goldengrape/91…
langchain里好多小坑要注意,特别是memory的设定。
这个demo中没有加入GUI和语音。 军师联盟在使用时,看起来应当在每轮时分开讨论,也就是各个军师不能看到其他军师的意见,否则形成了“回声放大”,后面的人都随声附和,没有独立思考了,貌似无法仅仅用prompt强制独立思考,只能临时屏蔽记忆,前5个独立发表意见以后,由最后一个总结,此时要纳入前5人的意见。
May 14, 2023 5 tweets 2 min read
#idea
做个语音GPT助手,将六顶思考帽的特征(wiki.mbalib.com/wiki/%E5%85%AD…) 赋予六位著名的军师,配上头像、声音、语言风格和三国的场景。

主公说一段话以后,六位军师各自发言,与主公讨论,帮助主公整理思路。

#貌似挺好做的 测试下,大概是这样:
langchain里设定不同军师的PromptTemplate,

KM_template = """
你是孔明, 三国时著名的军师.
你称我为"主公".
孔明特点123
{history}
主公: {human_input}
孔明:
"""
KM_prompt = PromptTemplate(
input_variables=["history", "human_input"],
template=KM_template
)
Apr 18, 2023 5 tweets 1 min read
有copilot,增加多语种的界面实在是太简单了。把UI上的文字放进json里,写出中文样例,后面的就一路tab就可以,copilot自行翻译。
所以现在chatpubmed chatpubmed.streamlit.app 的界面有这么多种语言的,而且你可以用母语提问,得到母语回答。 Image 我觉得这应该是每一个程序员/网站制作者都应该试试的东西,当然你们肯定比我做得更简单,比如单独写个程序用GPT去翻译所有界面上的文字。现在真的可以很简单就完成所有界面的翻译。

为什么不呢,让你的用户少一点点的困难,这不就是大家写程序的目的么
Apr 18, 2023 7 tweets 1 min read
Chat Pubmed
chatpubmed.streamlit.app
Talk to PubMed directly and it will find papers related to your question. Then, it will use the content of these fulltext to answer your question.
Let's work towards extending the average lifespan of humans, in our own small way. Chat Pubmed
chatpubmed.streamlit.app
直接与Pubmed对话,
为延长人类平均寿命做一点小小的贡献
Mar 21, 2023 8 tweets 1 min read
好吧,给个例子,其实跟把大象放进冰箱差不多。
题目:为ppt撰写演讲词
目的:读取一个ppt中的所有文本,依次为每一页撰写演讲词
1/ 过程设计
1. 读取pptx文件
2. 读取ppt中每一页的文字,包括正文中的文字和备注中的文字。
3. 对于第i页,令GPT依据全部文字和第i页的文字撰写演讲词
4. 将演讲词单独保存为markdown文件

2/
Mar 21, 2023 6 tweets 1 min read
GPT4协作编程要点:
0.建立一个markdown文件记录prompt
1.写明程序目的
2.写明程序实现目的的方法/流程
3.注明编程风格,要求GPT4写出函数的作用描述、输入、输出,但不必列出函数的具体实现。
4.由GPT4生成函数设计
5.注明需要使用的库,列出库中的几个典型示例,复制之上所有部分交GPT4生成代码 6.debug,将代码和报错一起交给GPT4,询问错误出现的原因,并修改。注意GPT4的知识过时,有可能引用不存在的库中的函数方法,可能需要以ChatPDF或者Bing Chat协助或者手动找到对应的函数,并找到说明或者示例,一同交给GPT4生成新代码。
7.记录debug要点于文件中。
8. cursor.so真好用
Mar 20, 2023 4 tweets 1 min read
字幕这个事,按外语水平,可以是一个连续谱,一端是全母语字幕,另一端是无字幕。
中间可以插入一些节点,比如:
[全母语字幕, 全外文字幕], (全外文字幕, 无字幕],
在这两个区间,又可以按照词频的顺序做出连续谱。
前一区间是中外混合字幕,从逐渐加入外文常用词,到逐渐减少外文常用词对应的母语 1/ [全母语字幕, 全外文字幕]之间可以有一个全中外混排字幕的节点,每个单词对应一个母语翻译,
这个节点开始打破了母语的语序和语法,以外文方式组织。
然后随着词频,逐渐抹去高词频的母语翻译,仅保留不熟悉的生词,一直到全外文字幕节点 2/
Mar 12, 2023 5 tweets 1 min read
所以,当前简单的双语PDF思路是这样的:
1. 按页处理PDF,先提取出原文中的第i页,
2.用PyMuPDF提取text,交给ChatGPT转换成markdown
3. 每行翻译markdown,原文译文混排。
4.用mdpdf(github.com/normanlorrain/…)转换成pdf,一般1-3页。
5.将原文PDF页和双语译文PDF交叉混排,重整成新的PDF输出 这样文件虽然肥厚了不少,但是文字格式经过markdown的“展平”,具有了延展性,用来放双语会比较美观。
而图表(drawing)、插图(image)和表格,则保留原来的形态和位置,方便查阅
Mar 11, 2023 5 tweets 1 min read
有没有可能借助GPT把一页PDF转换成朴实的html或者markdown?

所述朴实:
1。段内没有强制换行
2。文字以顺序排列
3。插图位于段落之间
4。表格以表格形式展现 github.com/pdf2htmlEX/pdf…
看了一个pdf2htmlEX的库,越看越觉得PDF真™的是一种非常邪贱的东西
Mar 10, 2023 4 tweets 1 min read
最大利用每一次对话长度,将尽可能多的参考资料发给GPT

length_max=3000
results = df.sort_values("similarity", ascending=False, ignore_index=True)
results['length_cumsum'] = results['length'].cumsum()
results = results[results['length_cumsum'] <= length_max]
n=len(results) 目前最喜欢是researchgpt的这个fork
github.com/MrPeterJin/res…
但在调用search_embeddings()时,参考资料数量用的是n=int(math.log2(number_of_pages)页码数量取log2,感觉很武断。
考虑到一篇文献问题并不会太多,找到答案才最重要,所以应当尽量利用每一次对话,尽量多塞参考资料
Mar 7, 2023 9 tweets 2 min read
如果把一本书中的每一段取出来,按顺序做embed-vec,然后我们再提个问题,也做embed-vec,依序对每一段的向量做cos,算相似性,可以得到一条曲线,然后我们再换个问题得到另一条曲线,当然问题之间也是有相似性的,所以也可以有一定的间距,于是最终得到一个曲面。
突然语文老师当年讲的哪些就定量了 你会看到首尾呼应——起点和终点的隆起,你会看到不同的线索,就像山脊,有分支,有汇合,有解决,有冲突……
然后,好的作品可能还像是分形,放大局部,又出现一组自相似的结构……
Mar 5, 2023 4 tweets 1 min read
昨天有@yihong0618 的双语书替代了DeepL的文档翻译,
今天看到editgpt.app 替代了grammaly,自己还顺手写了一个

明天又能换掉谁呢? 目前一些候选:
语音输入整理,win+H;
记账;
GTD;
笔记、文献索引;
字幕/书仅标记生词,解释文中意思;
Mar 5, 2023 4 tweets 1 min read
可怕,本来是很复杂的语法检查,结果用一句“proofread this”作为提示语就完成了,然后就是文本比对再标记出来(如果你想要学英语知道改在哪里的话),然后@Grammarly 的功能就这么被替代掉了。 @Grammarly 先调用openai的api,
然后用上python的原生库difflib检查前后字符串,
再配上一个漂亮的markdown输出,
最后用streamlit就可以包装成一个web应用(更有追求就用个Flask)

Grammarly市值13个Billon刀啊,就这样樯橹灰飞烟灭。