copy_page.S 6.1 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259260261262263264265266267268269270271272273274275276277278279280281282283284285286287288289290291292293294295296297298299300301302303304305306307308309310311312313314315316317318319320321322323324325326327328329330331332333334335336337338339340341342343344345346347348349350351352353354355356357358359360361362363364365366367368369370371372373374375376377378379380381382383384385386387388389390391392393394395396397398
  1. /*
  2. * copy_page, __copy_user_page, __copy_user implementation of SuperH
  3. *
  4. * Copyright (C) 2001 Niibe Yutaka & Kaz Kojima
  5. * Copyright (C) 2002 Toshinobu Sugioka
  6. * Copyright (C) 2006 Paul Mundt
  7. */
  8. #include <linux/linkage.h>
  9. #include <asm/page.h>
  10. /*
  11. * copy_page_slow
  12. * @to: P1 address
  13. * @from: P1 address
  14. *
  15. * void copy_page_slow(void *to, void *from)
  16. */
  17. /*
  18. * r0, r1, r2, r3, r4, r5, r6, r7 --- scratch
  19. * r8 --- from + PAGE_SIZE
  20. * r9 --- not used
  21. * r10 --- to
  22. * r11 --- from
  23. */
  24. ENTRY(copy_page_slow)
  25. mov.l r8,@-r15
  26. mov.l r10,@-r15
  27. mov.l r11,@-r15
  28. mov r4,r10
  29. mov r5,r11
  30. mov r5,r8
  31. mov.l .Lpsz,r0
  32. add r0,r8
  33. !
  34. 1: mov.l @r11+,r0
  35. mov.l @r11+,r1
  36. mov.l @r11+,r2
  37. mov.l @r11+,r3
  38. mov.l @r11+,r4
  39. mov.l @r11+,r5
  40. mov.l @r11+,r6
  41. mov.l @r11+,r7
  42. #if defined(CONFIG_CPU_SH3)
  43. mov.l r0,@r10
  44. #elif defined(CONFIG_CPU_SH4)
  45. movca.l r0,@r10
  46. mov r10,r0
  47. #endif
  48. add #32,r10
  49. mov.l r7,@-r10
  50. mov.l r6,@-r10
  51. mov.l r5,@-r10
  52. mov.l r4,@-r10
  53. mov.l r3,@-r10
  54. mov.l r2,@-r10
  55. mov.l r1,@-r10
  56. #if defined(CONFIG_CPU_SH4)
  57. ocbwb @r0
  58. #endif
  59. cmp/eq r11,r8
  60. bf/s 1b
  61. add #28,r10
  62. !
  63. mov.l @r15+,r11
  64. mov.l @r15+,r10
  65. mov.l @r15+,r8
  66. rts
  67. nop
  68. #if defined(CONFIG_CPU_SH4)
  69. /*
  70. * __copy_user_page
  71. * @to: P1 address (with same color)
  72. * @from: P1 address
  73. * @orig_to: P1 address
  74. *
  75. * void __copy_user_page(void *to, void *from, void *orig_to)
  76. */
  77. /*
  78. * r0, r1, r2, r3, r4, r5, r6, r7 --- scratch
  79. * r8 --- from + PAGE_SIZE
  80. * r9 --- orig_to
  81. * r10 --- to
  82. * r11 --- from
  83. */
  84. ENTRY(__copy_user_page)
  85. mov.l r8,@-r15
  86. mov.l r9,@-r15
  87. mov.l r10,@-r15
  88. mov.l r11,@-r15
  89. mov r4,r10
  90. mov r5,r11
  91. mov r6,r9
  92. mov r5,r8
  93. mov.l .Lpsz,r0
  94. add r0,r8
  95. !
  96. 1: ocbi @r9
  97. add #32,r9
  98. mov.l @r11+,r0
  99. mov.l @r11+,r1
  100. mov.l @r11+,r2
  101. mov.l @r11+,r3
  102. mov.l @r11+,r4
  103. mov.l @r11+,r5
  104. mov.l @r11+,r6
  105. mov.l @r11+,r7
  106. movca.l r0,@r10
  107. mov r10,r0
  108. add #32,r10
  109. mov.l r7,@-r10
  110. mov.l r6,@-r10
  111. mov.l r5,@-r10
  112. mov.l r4,@-r10
  113. mov.l r3,@-r10
  114. mov.l r2,@-r10
  115. mov.l r1,@-r10
  116. ocbwb @r0
  117. cmp/eq r11,r8
  118. bf/s 1b
  119. add #28,r10
  120. !
  121. mov.l @r15+,r11
  122. mov.l @r15+,r10
  123. mov.l @r15+,r9
  124. mov.l @r15+,r8
  125. rts
  126. nop
  127. #endif
  128. .align 2
  129. .Lpsz: .long PAGE_SIZE
  130. /*
  131. * __kernel_size_t __copy_user(void *to, const void *from, __kernel_size_t n);
  132. * Return the number of bytes NOT copied
  133. */
  134. #define EX(...) \
  135. 9999: __VA_ARGS__ ; \
  136. .section __ex_table, "a"; \
  137. .long 9999b, 6000f ; \
  138. .previous
  139. ENTRY(__copy_user)
  140. tst r6,r6 ! Check explicitly for zero
  141. bf 1f
  142. rts
  143. mov #0,r0 ! normal return
  144. 1:
  145. mov.l r10,@-r15
  146. mov.l r9,@-r15
  147. mov.l r8,@-r15
  148. mov r4,r3
  149. add r6,r3 ! last destination address
  150. mov #12,r0 ! Check if small number of bytes
  151. cmp/gt r0,r6
  152. bt 2f
  153. bra .L_cleanup_loop
  154. nop
  155. 2:
  156. neg r5,r0 ! Calculate bytes needed to align source
  157. add #4,r0
  158. and #3,r0
  159. tst r0,r0
  160. bt .L_jump
  161. mov r0,r1
  162. .L_loop1:
  163. ! Copy bytes to align source
  164. EX( mov.b @r5+,r0 )
  165. dt r1
  166. EX( mov.b r0,@r4 )
  167. add #-1,r6
  168. bf/s .L_loop1
  169. add #1,r4
  170. .L_jump:
  171. mov r6,r2 ! Calculate number of longwords to copy
  172. shlr2 r2
  173. tst r2,r2
  174. bt .L_cleanup
  175. mov r4,r0 ! Jump to appropriate routine
  176. and #3,r0
  177. mov r0,r1
  178. shll2 r1
  179. mova .L_jump_tbl,r0
  180. mov.l @(r0,r1),r1
  181. jmp @r1
  182. nop
  183. .align 2
  184. .L_jump_tbl:
  185. .long .L_dest00
  186. .long .L_dest01
  187. .long .L_dest10
  188. .long .L_dest11
  189. ! Destination = 00
  190. .L_dest00:
  191. mov r2,r7
  192. shlr2 r7
  193. shlr r7
  194. tst r7,r7
  195. mov #7,r0
  196. bt/s 1f
  197. and r0,r2
  198. .align 2
  199. 2:
  200. EX( mov.l @r5+,r0 )
  201. EX( mov.l @r5+,r8 )
  202. EX( mov.l @r5+,r9 )
  203. EX( mov.l @r5+,r10 )
  204. EX( mov.l r0,@r4 )
  205. EX( mov.l r8,@(4,r4) )
  206. EX( mov.l r9,@(8,r4) )
  207. EX( mov.l r10,@(12,r4) )
  208. EX( mov.l @r5+,r0 )
  209. EX( mov.l @r5+,r8 )
  210. EX( mov.l @r5+,r9 )
  211. EX( mov.l @r5+,r10 )
  212. dt r7
  213. EX( mov.l r0,@(16,r4) )
  214. EX( mov.l r8,@(20,r4) )
  215. EX( mov.l r9,@(24,r4) )
  216. EX( mov.l r10,@(28,r4) )
  217. bf/s 2b
  218. add #32,r4
  219. tst r2,r2
  220. bt .L_cleanup
  221. 1:
  222. EX( mov.l @r5+,r0 )
  223. dt r2
  224. EX( mov.l r0,@r4 )
  225. bf/s 1b
  226. add #4,r4
  227. bra .L_cleanup
  228. nop
  229. ! Destination = 10
  230. .L_dest10:
  231. mov r2,r7
  232. shlr2 r7
  233. shlr r7
  234. tst r7,r7
  235. mov #7,r0
  236. bt/s 1f
  237. and r0,r2
  238. 2:
  239. dt r7
  240. #ifdef __LITTLE_ENDIAN__
  241. EX( mov.l @r5+,r0 )
  242. EX( mov.l @r5+,r1 )
  243. EX( mov.l @r5+,r8 )
  244. EX( mov.l @r5+,r9 )
  245. EX( mov.l @r5+,r10 )
  246. EX( mov.w r0,@r4 )
  247. add #2,r4
  248. xtrct r1,r0
  249. xtrct r8,r1
  250. xtrct r9,r8
  251. xtrct r10,r9
  252. EX( mov.l r0,@r4 )
  253. EX( mov.l r1,@(4,r4) )
  254. EX( mov.l r8,@(8,r4) )
  255. EX( mov.l r9,@(12,r4) )
  256. EX( mov.l @r5+,r1 )
  257. EX( mov.l @r5+,r8 )
  258. EX( mov.l @r5+,r0 )
  259. xtrct r1,r10
  260. xtrct r8,r1
  261. xtrct r0,r8
  262. shlr16 r0
  263. EX( mov.l r10,@(16,r4) )
  264. EX( mov.l r1,@(20,r4) )
  265. EX( mov.l r8,@(24,r4) )
  266. EX( mov.w r0,@(28,r4) )
  267. bf/s 2b
  268. add #30,r4
  269. #else
  270. EX( mov.l @(28,r5),r0 )
  271. EX( mov.l @(24,r5),r8 )
  272. EX( mov.l @(20,r5),r9 )
  273. EX( mov.l @(16,r5),r10 )
  274. EX( mov.w r0,@(30,r4) )
  275. add #-2,r4
  276. xtrct r8,r0
  277. xtrct r9,r8
  278. xtrct r10,r9
  279. EX( mov.l r0,@(28,r4) )
  280. EX( mov.l r8,@(24,r4) )
  281. EX( mov.l r9,@(20,r4) )
  282. EX( mov.l @(12,r5),r0 )
  283. EX( mov.l @(8,r5),r8 )
  284. xtrct r0,r10
  285. EX( mov.l @(4,r5),r9 )
  286. mov.l r10,@(16,r4)
  287. EX( mov.l @r5,r10 )
  288. xtrct r8,r0
  289. xtrct r9,r8
  290. xtrct r10,r9
  291. EX( mov.l r0,@(12,r4) )
  292. EX( mov.l r8,@(8,r4) )
  293. swap.w r10,r0
  294. EX( mov.l r9,@(4,r4) )
  295. EX( mov.w r0,@(2,r4) )
  296. add #32,r5
  297. bf/s 2b
  298. add #34,r4
  299. #endif
  300. tst r2,r2
  301. bt .L_cleanup
  302. 1: ! Read longword, write two words per iteration
  303. EX( mov.l @r5+,r0 )
  304. dt r2
  305. #ifdef __LITTLE_ENDIAN__
  306. EX( mov.w r0,@r4 )
  307. shlr16 r0
  308. EX( mov.w r0,@(2,r4) )
  309. #else
  310. EX( mov.w r0,@(2,r4) )
  311. shlr16 r0
  312. EX( mov.w r0,@r4 )
  313. #endif
  314. bf/s 1b
  315. add #4,r4
  316. bra .L_cleanup
  317. nop
  318. ! Destination = 01 or 11
  319. .L_dest01:
  320. .L_dest11:
  321. ! Read longword, write byte, word, byte per iteration
  322. EX( mov.l @r5+,r0 )
  323. dt r2
  324. #ifdef __LITTLE_ENDIAN__
  325. EX( mov.b r0,@r4 )
  326. shlr8 r0
  327. add #1,r4
  328. EX( mov.w r0,@r4 )
  329. shlr16 r0
  330. EX( mov.b r0,@(2,r4) )
  331. bf/s .L_dest01
  332. add #3,r4
  333. #else
  334. EX( mov.b r0,@(3,r4) )
  335. shlr8 r0
  336. swap.w r0,r7
  337. EX( mov.b r7,@r4 )
  338. add #1,r4
  339. EX( mov.w r0,@r4 )
  340. bf/s .L_dest01
  341. add #3,r4
  342. #endif
  343. ! Cleanup last few bytes
  344. .L_cleanup:
  345. mov r6,r0
  346. and #3,r0
  347. tst r0,r0
  348. bt .L_exit
  349. mov r0,r6
  350. .L_cleanup_loop:
  351. EX( mov.b @r5+,r0 )
  352. dt r6
  353. EX( mov.b r0,@r4 )
  354. bf/s .L_cleanup_loop
  355. add #1,r4
  356. .L_exit:
  357. mov #0,r0 ! normal return
  358. 5000:
  359. # Exception handler:
  360. .section .fixup, "ax"
  361. 6000:
  362. mov.l 8000f,r1
  363. mov r3,r0
  364. jmp @r1
  365. sub r4,r0
  366. .align 2
  367. 8000: .long 5000b
  368. .previous
  369. mov.l @r15+,r8
  370. mov.l @r15+,r9
  371. rts
  372. mov.l @r15+,r10